



## PATENT ABSTRACTS OF JAPAN

(11) Publication number: 2002157291 A

(43) Date of publication of application: 31.05.02

(51) Int. Cl

**G06F 17/50****H01L 21/82****H01L 27/04****H01L 21/822**

(21) Application number: 2000349938

(22) Date of filing: 16.11.00

(71) Applicant

MATSHISHITA ELECTRIC IND CO LTD

(72) Inventor:

TAKEMURA KAZUYOSHI

**(54) METHOD FOR DESIGNING SEMICONDUCTOR INTEGRATED CIRCUIT DEVICE****(57) Abstract:**

**PROBLEM TO BE SOLVED:** To provide a method for designing a semiconductor integrated circuit device for selecting IP flexibly while securing the function of a system surely.

**SOLUTION:** After performing function design and IP function design, the architecture design of the system is performed. After mapping for assigning respective functions (function blocks) to the component of architecture, performance analysis is performed. Next, HW design, SW design, HW/SW cooperative verification, real chip verification are performed. By performing hierarchical development of an IP function at a function block level in the IP function design in particular, HW/SW division by each function block becomes possible and the system is optimized. Furthermore, dynamic analysis with switching of HW/SW by each function block becomes possible.

COPYRIGHT: (C)2002,JPO



**THIS PAGE BLANK (USPTO)**

(19)日本国特許庁 (JP)

(12) 公開特許公報 (A)

(11)特許出願公開番号

特開2002-157291

(P2002-157291A)

(43)公開日 平成14年5月31日 (2002.5.31)

(51)Int.Cl.  
G 06 F 17/50

識別記号  
6 5 4

F I  
G 06 F 17/50

マーク (参考)

6 5 4 M 5 B 0 4 6  
6 5 4 G 5 F 0 3 8  
6 5 4 K 5 F 0 6 4  
6 5 2 C  
6 5 8 T

6 5 2  
6 5 8

審査請求 有 請求項の数18 OL (全 24 頁) 最終頁に続く

(21)出願番号 特願2000-349938(P2000-349938)

(71)出願人 000005821

松下電器産業株式会社

大阪府門真市大字門真1006番地

(22)出願日 平成12年11月16日 (2000.11.16)

(72)発明者 竹村 和祥

大阪府門真市大字門真1006番地 松下電器

産業株式会社内

(74)代理人 100077931

弁理士 前田 弘 (外7名)

(54)【発明の名称】 半導体集積回路装置の設計方法

(57)【要約】

【課題】 システムの機能を確実に確保しながら IP の柔軟な選択を行なうための半導体集積回路装置の設計方法を提供する。

【解決手段】 機能設計と、IP機能設計を行なったあと、システムのアーキテクチャ設計を行なう。各機能 (機能ブロック) をアーキテクチャのコンポーネントに割り当てるマッピングを行なった後、性能解析を行なう。次に、HW設計と、SW設計と、HW/SW協調検証と、実チップ検証とを行なう。特に、IP機能設計において IP機能を機能ブロックレベルに階層展開を行うことにより、機能ブロックごとにHW/SW分割することが可能になり、より最適化されたシステムが得られる。また、機能ブロックごとにHW/SWの切り換えを伴う動的解析も可能になる。



【特許請求の範囲】

【請求項1】 共通の機能を有する複数のIPを、複数の機能について記憶装置に格納するステップ(a)と、ある仕様を満たすための機能群構造を構築するステップ(b)と、  
上記記憶装置から上記機能群構造中の各機能について、当該機能を共通に有する複数のIPから1つのIPを選択して取り出して、上記機能群構造中の各機能と置き換えるステップ(c)とを含む半導体集積回路装置の設計方法。

【請求項2】 請求項1記載の半導体集積回路装置の設計方法において、  
上記各機能ごとに、当該機能の実現対象をデータベースのアーキテクチャモデル中のHWモデルとSWモデルとに割り当てるよう分割するステップ(e)とをさらに含むことを特徴とする半導体集積回路装置の設計方法。

【請求項3】 請求項2記載の半導体集積回路装置の設計方法において、  
上記ステップ(c)の後、上記IPの階層を機能プロックレベルに展開するステップ(d)をさらに含み、  
上記ステップ(e)では、上記展開された各機能プロックごとに、当該機能プロックの実現対象をアーキテクチャモデル中のHWモデルとSWモデルとに割り当てることを特徴とする半導体集積回路装置の設計方法。

【請求項4】 各々ある機能を有する複数のIPを記憶装置に格納するステップ(a)と、  
ある仕様を満たすための機能群構造を構築するステップ(b)と、  
上記記憶装置から上記機能群構造中の各機能について、当該機能を有するIPを選択して取り出して、上記機能群構造中の各機能と置き換えるステップ(c)と、  
上記IPを機能プロックレベルに階層展開するステップ(d)と、  
上記階層展開された各機能プロックごとに、当該機能プロックの実現化対象をデータベースのアーキテクチャモデル中のHW(ハードウェア)モデルとSW(ソフトウェア)モデルとに割り当てるよう分割するステップ(e)とを含む半導体集積回路装置の設計方法。

【請求項5】 請求項4記載の半導体集積回路装置の設計方法において、  
上記ステップ(e)では、機能プロックのHWの部分から面積の重複を考慮した静的解析を行なうことを特徴とする半導体集積回路装置の設計方法。

【請求項6】 請求項4記載の半導体集積回路装置の設計方法において、  
上記ステップ(e)の後、割り当てられた上記機能群構造中の各機能プロックのHWモデルとSWモデルとの割り当てを決定するための動的性能解析を行なうステップ(f)をさらに含むことを特徴とする半導体集積回路装置の設計方法。

【請求項7】 請求項6記載の半導体集積回路装置の設計方法において、  
上記データベースには、HWの機能毎に当該HWと等価な機能を有するSWモデルを格納しておくことを特徴とする半導体集積回路装置の設計方法。

【請求項8】 請求項7記載の半導体集積回路装置の設計方法において、  
上記ステップ(f)では、時間軸に沿って消費電力が常に上限値を超えないように各機能プロックのHWモデルとSWモデルとの割り当てを切り換えることを特徴とする半導体集積回路装置の設計方法。

【請求項9】 請求項5記載の半導体集積回路装置の設計方法において、  
上記ステップ(f)では、ある機能プロックをHWに割り当てるときのCPUの負荷率がある下限値よりも小さいときは、当該機能プロックの割り当てをSWに切り換えることを特徴とする半導体集積回路装置の設計方法。

【請求項10】 請求項5～9のうちいずれか1つに記載の半導体集積回路装置の設計方法において、  
上記ステップ(e)では、メモリの消費電力を考慮した解析を行なうことを特徴とする半導体集積回路装置の設計方法。

【請求項11】 複数のHWのコンポーネントをアーキテクチャモデルとして記憶装置に格納するステップ(a)と、  
上記記憶装置からアーキテクチャモデルをコンポーネント群として取り出して、このコンポーネント群によりある仕様を満たすアーキテクチャを構築するステップ(b)とを含み、  
上記ステップ(b)では、コンポーネント群に複数のバスと各バス間を接続するバスプリッジモデルとが含まれるように上記アーキテクチャを構築することを特徴とする半導体集積回路装置の設計方法。

【請求項12】 請求項11記載の半導体集積回路装置の設計方法において、  
上記ステップ(b)では、上記バスプリッジモデルが、バス幅が互いに異なる2つのバス間をバス幅及びデータ転送速度を調整するように接続していることを特徴とする半導体集積回路装置の設計方法。

【請求項13】 複数のHWのコンポーネントをアーキテクチャモデルとして記憶装置に格納するステップ(a)と、  
上記記憶装置からアーキテクチャモデルをコンポーネント群として取り出して、このコンポーネント群によりある仕様を満たすアーキテクチャを構築するステップ(b)と、  
上記仕様を満たすための機能群構造を構築するステップ(c)と、  
上記機能群構造の入力側及び出力側にテストベンチを付設するステップ(d)と、

上記機能群構造中の機能及びテストベンチを上記アーキテクチャ中のコンポーネントに割り当てるステップ (e) とを含む半導体集積回路装置の設計方法。

【請求項14】 請求項13記載の半導体集積回路装置の設計方法において、

上記ステップ (a) では、上記複数のコンポーネントの中にI/Fモデルを含めておき、

上記ステップ (b) では、上記コンポーネント群にI/Fモデルを含めるように上記アーキテクチャを構築することを特徴とする半導体集積回路装置の設計方法。

【請求項15】 請求項14記載の半導体集積回路装置の設計方法において、

上記ステップ (e) では、上記入力側又は出力側のテストベンチを上記アーキテクチャ中のI/Fモデルに割り当てる特徴とする半導体集積回路装置の設計方法。

【請求項16】 請求項13～15のうちいずれか1つに記載の半導体集積回路装置の設計方法において、

上記ステップ (a) では、上記複数のコンポーネントの中にメモリ含めておき、

上記ステップ (b) では、上記コンポーネント群にメモリを含めるように上記アーキテクチャを構築し、

上記ステップ (e) では、上記入力側又は出力側のテストベンチを上記アーキテクチャ中のメモリに割り当てる特徴とする半導体集積回路装置の設計方法。

【請求項17】 各々ある機能を有する複数のIPを記憶装置に格納するステップ (a) と、

ある仕様を満たすための機能群構造を構築するステップ (b) と、

上記記憶装置から上記機能群構造中の各機能について、当該機能を有するIPを選択して取り出して、上記機能群構造中の各機能と置き換えるステップ (c) と、

上記IPを機能ブロックレベルに階層展開するステップ (d) と、

上記階層展開された各機能ブロックをアーキテクチャモデル中のコンポーネントに割り当てるステップ (e) と、

上記機能ブロックから当該機能ブロックの出力を受ける他の機能ブロックまでの経路を、上記アーキテクチャモデル中のコンポーネント間の経路として記述する機能ブロック間テーブルを作成するステップ (f) とを含む半導体集積回路装置の設計方法。

【請求項18】 各々ある機能を有する複数のIPを記憶装置に格納するステップ (a) と、

ある仕様を満たすための機能群構造を構築するステップ (b) と、

上記記憶装置から上記機能群構造中の各機能について、当該機能を有するIPを選択して取り出して、上記機能群構造中の各機能と置き換えるステップ (c) と、

上記機能群中の各機能をデータベースのアーキテクチャ

モデル中のコンポーネントに割り当てるステップ (e) と、

上記コンポーネントのバスアクセスのための優先度を設定するステップ (f) と、

上記機能群構造の各機能が上記コンポーネントに割り当てられた状態で上記機能群構造の静的な性能解析を行うステップ (g) とを含み、

上記静的な性能解析においては、上記各コンポーネントのアーキテクチャモデル中におけるバスアクセスの優先度をトグル数と見なして上記機能群構造の消費電力を計算することを特徴とする半導体集積回路装置の設計方法。

【発明の詳細な説明】

【0001】

【発明の属する技術分野】 本発明は、複数の機能を有する回路を複数個配置した半導体集積回路装置の設計方法に関する。

【0002】

【従来の技術】 近年、複数のLSIを共通の基板上に形成したシステムLSIという概念が提起されており、システムLSIの設計手法としても各種の提案がなされている。特に、システムLSIの利点は、DRAMなどのメモリや、ロジックLSIや、高周波回路などのアナログ回路を1つの半導体装置内に収納して、多種、多機能の半導体装置を極めて高集積化して実現することができる。

【0003】

【発明が解決しようとする課題】 ところで、上記従来のシステムLSIにおいては、システムLSIを設計する際に、IP、コアと呼ばれる設計資産を利用することが多い。そのとき、各コアは個別に設計されたものなので、これらを統合したときには必ずしも円滑な動作が得られないことがある。しかし、従来のコア又はIPは、その中身がブラックボックスとなっているので、円滑な動作を確保するシステムを設計するためには多大の手間と時間を要しているのが現実である。

【0004】 本発明の目的は、IPの機能の同一性を図りつつIPの選択を柔軟に行なうための手段を講ずることにより、最適化が容易な半導体集積回路装置の設計方法の提供を図ることにある。

【0005】

【課題を解決するための手段】 本発明の第1の半導体集積回路装置の設計方法は、共通の機能を有する複数のIPを、複数の機能について記憶装置に格納するステップ (a) と、ある仕様を満たすための機能群構造を構築するステップ (b) と、上記記憶装置から上記機能群構造中の各機能について、当該機能を共通に有する複数のIPから1つのIPを選択して取り出して、上記機能群構造中の各機能と置き換えるステップ (c) とを含んでいる。

【0006】この方法により、機能が互いに共通する複数のIPをLibに格納しておいて、機能ごとに適当なIPを選択することができるので、IPを代えても機能の同一性が保持される。したがって、従来大きかった設計変更の確率をできるだけ小さくすることができる。

【0007】上記各機能ごとに、当該機能の実現対象をデータベースのアーキテクチャモデル中のHWモデルとSWモデルとに割り当てるように分割するステップ(e)とをさらに含むことにより、最適化された半導体集積回路装置を設計することができる。ができる。

【0008】上記ステップ(c)の後、上記IPの階層を機能ブロックレベルに展開するステップ(d)をさらに含み、上記ステップ(e)では、上記展開された各機能ブロックごとに、当該機能ブロックの実現対象をアーキテクチャモデル中のHWモデルとSWモデルとに割り当てるにより、より最適化された半導体集積回路装置を設計することができる。

【0009】本発明の第2の半導体装置集積回路装置の設計方法は、各々ある機能を有する複数のIPを記憶装置に格納するステップ(a)と、ある仕様を満たすための機能群構造を構築するステップ(b)と、上記記憶装置から上記機能群構造中の各機能について、当該機能を有するIPを選択して取り出して、上記機能群構造中の各機能と置き換えるステップ(c)と、上記IPを機能ブロックレベルに階層展開するステップ(d)と、上記階層展開された各機能ブロックごとに、当該機能ブロックの実現化対象をデータベースのアーキテクチャモデル中のHWモデルとSWモデルとに割り当てるように分割するステップ(e)とを含んでいる。

【0010】このように、IPを階層展開してからHWモデルとSWモデルとに分割することにより、IP内をHWモデルとSWモデルとに区別してマッピングを行なうことが可能となり、IP毎にマッピングする場合に比べて、より最適化されたシステムの設計が可能になる。

【0011】上記ステップ(e)では、機能ブロックのHWの部分から面積の重複を考慮した静的解析を行なうことにより、面積の計算精度の悪化を防止することができる。

【0012】上記ステップ(e)の後、割り当てられた上記機能群構造中の各機能ブロックのHWモデルとSWモデルとの割り当てを切り換える動的性能解析を行なうステップ(f)をさらに含むことにより、解析精度の向上を図ることができる。

【0013】上記データベースには、HWの機能毎に当該HWと等価な機能を有するSWモデルを格納しておくことが好ましい。

【0014】上記ステップ(f)では、時間軸に沿って消費電力が常に上限値を超えないように各機能ブロックのHWモデルとSWモデルとの割り当てを切り換えることができる。

【0015】上記ステップ(f)では、ある機能ブロックをHWモデルに割り当てたときのCPUの負荷率がある下限値よりも小さいときは、当該機能ブロックの割り当てをSWに切り換えることができる。

【0016】記ステップ(e)では、メモリの消費電力を考慮した解析を行なうことを特徴とする半導体集積回路装置の設計方法。

【0017】本発明の第3の半導体装置集積回路装置の設計方法は、複数のHWのコンポーネントをアーキテクチャモデルとして記憶装置に格納するステップ(a)と、上記記憶装置からアーキテクチャモデルをコンポーネント群として取り出して、このコンポーネント群によりある仕様を満たすアーキテクチャを構築するステップ(b)とを含み、上記ステップ(b)では、コンポーネント群に複数のバスと各バス間を接続するバスプリッジモデルとが含まれるよう上記アーキテクチャを構築する方法である。

【0018】このような複数のバスを設けることにより、IPOSデバイスのような半導体配線基板を有する構造に適したアーキテクチャを構築することができる。

【0019】上記ステップ(b)では、上記バスプリッジモデルが、バス幅が互いに異なる2つのバス間をバス幅及びデータ転送速度を調整するように接続していることにより、当該バスプリッジモデルに接続される2つのバスのバス幅やデータ転送速度が互いに異なる場合などにおいてもデータの円滑な転送を図ることができる。

【0020】本発明の第4の半導体装置集積回路装置の設計方法は、複数のHWのコンポーネントをアーキテクチャモデルとして記憶装置に格納するステップ(a)と、上記記憶装置からアーキテクチャモデルをコンポーネント群として取り出して、このコンポーネント群によりある仕様を満たすアーキテクチャを構築するステップ(b)と、上記仕様を満たすための機能群構造を構築するステップ(c)と、上記機能群構造の入力側及び出力側にテストベンチを付設するステップ(d)と、上記機能群構造中の機能及びテストベンチを上記アーキテクチャ中のコンポーネントに割り当てるステップ(e)とを含んでいる。

【0021】この方法により、テストベンチをHWにマッピングすることが可能になり、性能解析などにテストベンチの入出力に要する時間などのパラメータを含めることができる。

【0022】上記ステップ(a)では、上記複数のコンポーネントの中にI/Fモデルを含めておき、上記ステップ(b)では、上記コンポーネント群にI/Fモデルを含めるように上記アーキテクチャを構築することにより、入出力の信号を取り扱うI/Fモデルにおける信号の遅延や消費電力を考慮したシステムの最適化が可能になる。

【0023】上記ステップ(e)では、上記入力側のテ

ストベンチを上記アーキテクチャ中の I/F モデルに割り当てることにより、従来、単に入力信号として扱っていたテストベンチが HW である I/F モデルにマッピングされるので、後の性能解析の際に遅延を考慮した処理時間の解析が可能になり、また、 I/F が動作することを考慮した消費電力の解析が可能になる。つまり、解析精度の向上を図ることができる。

【0024】上記ステップ (a) では、上記複数のコンポーネントの中にメモリ含めておき、上記ステップ (b) では、上記コンポーネント群にメモリを含めるように上記アーキテクチャを構築し、上記ステップ (e) では、上記出力側のテストベンチを上記アーキテクチャモデル中のメモリに割り当てることもできる。

【0025】本発明の第5の半導体装置集積回路装置の設計方法は、各々ある機能を有する複数の IP を記憶装置に格納するステップ (a) と、ある仕様を満たすための機能群構造を構築するステップ (b) と、上記記憶装置から上記機能群構造中の各機能について、当該機能を有する IP を選択して取り出して、上記機能群構造中の各機能と置き換えるステップ (c) と、上記 IP を機能ブロックレベルに階層展開するステップ (d) と、上記階層展開された各機能ブロックをアーキテクチャ中のコンポーネントに割り当てるステップ (e) と、上記機能ブロックから当該機能ブロックの出力を受ける他の機能ブロックまでの経路を、上記アーキテクチャ中のコンポーネント間の経路として記述する機能ブロック間テーブルを作成するステップ (f) とを含んでいる。

【0026】このように機能ブロック間パステーブルを作成することにより、動的な性能解析を精度よく行なうことができる。

【0027】本発明の第6の半導体装置集積回路装置の設計方法は、各々ある機能を有する複数の IP を記憶装置に格納するステップ (a) と、ある仕様を満たすための機能群構造を構築するステップ (b) と、上記記憶装置から上記機能群構造中の各機能について、当該機能を有する IP を選択して取り出して、上記機能群構造中の各機能と置き換えるステップ (c) と、上記機能群中の各機能をデータベースのアーキテクチャモデル中のコンポーネントに割り当てるステップ (e) と、上記コンポーネントのバスアクセスのための優先度を設定するステップ (f) と、上記機能群構造の各機能が上記コンポーネントに割り当てられた状態で上記機能群構造の静的な性能解析を行なうステップ (g) とを含み、上記静的な性能解析においては、上記各コンポーネントのアーキテクチャモデル中におけるバスアクセスの優先度をトグル数と見なして上記機能群構造の消費電力を計算する方法である。

【0028】優先度をトグル数の代わりに用いることで、トグル数がわからない静的解析においても、ある程度の精度で消費電力が求まることになる。

## 【0029】

【発明の実施の形態】 - IPOS デバイスの基本的な構造 -

ここで配線の断面積を大きく確保しつつ、多種、多機能のデバイスを内蔵した半導体装置を実現するための1つの手段として、配線層を有する半導体配線基板例えればシリコン配線基板 (Super-Sub) 上に、各種デバイスを内蔵したチップ IP を搭載する構成がある。その場合、各チップ IP 内に設けられる回路 (IC) は半導体装置の設計上 IP (Intellectual Property) として扱うことができ、各種 IP を半導体配線基板上に貼り合わせたものと考えることができる。つまり、半導体デバイス全体は、“IP On Super-Sub” であるので、シリコン配線基板と IP 群とを備えた半導体デバイス全体を “IPOS デバイス” とする。

【0030】図1 (a), (b), (c) は、IP (チップ IP) 群を搭載するための配線基板となるシリコン配線基板の平面図、シリコン配線基板上に搭載される IP 群の例を示す平面図、及びシリコン配線基板の断面図である。図1 (a), (b) に示すように、シリコン配線基板 10 上には各種 IP を搭載するための複数の領域が設けられており、各領域には、例えば、Analog-IP, Logic-IP, CPU-IP, Flash メモリー-IP, SRAM-IP, DRAM-IP, I/O-IP などの各種 IP 群がチップ IP として搭載可能となっている。図1 (c) に示すように、シリコン配線基板 10 は、シリコン基板 11 と、シリコン基板 10 上に絶縁膜 (図示せず) を挟んで設けられたグランドプレーン 12 と、グランドプレーン 12 の上に層間絶縁膜を挟んで設けられた第1配線層 13 と、第1配線層 13 の上に層間絶縁膜を挟んで設けられた第2配線層 14 と、第2配線層 14 の上にパッシベーション膜を挟んで設けられたパッド 15 とを備えている。パッド 15, 各配線層 13, 14 及びグランドプレーン 12 間は、それぞれコンタクト (図示せず) を介して所望の部位で互いに接続されている。そして、各 IP は、パッド 15 上に貼り付けられて、各 IP が配線層 13, 14 により互いにあるいはグランドプレーン 12 に電気的に接続される構造となっている。

【0031】シリコン配線基板 10 内の配線層 13, 14 の寸法の制約は緩やかであり、数  $\mu$ m 幅の配線をも設けることができるので、以下のような効果がある。経験的に、今までの半導体集積回路装置の微細化が進展した過程において、もっとも配線としての特性が良好であった世代の寸法を有する配線を設けることが可能となる。また、配線の電気インピーダンスを低減することができる。

【0032】そして、シリコン配線基板上のチップ IP は多くの機能を有しているが、これに対しては2つの考え方がある。1つは、できるだけ多くの機能を使用する

という考え方であり、もう1つは、使用する機能を制限するという考え方である。つまり、ユーザの多様な要求に応えるためには、多種の使用方法に対応できる構成を有していることが好ましいが、反面、実際の使用に際してはいずれかの機能に限定する必要がある。つまり、この2つの相反する要求を満足させることにより、ユーザの多様な要求に応えつつ、少品種、大量生産に適したIPOSデバイスを構築することができる。

【0033】したがって、後に選択、制限、切り換え、設定などの処理を柔軟に行なうことを前提として、つまり、機能に関する処理の柔軟性を保持しつつ、多種の機能をハードウェア(HW)、ソフトウェア(SW)に分けて各IP(チップIP)に組み込むことが重要となる。

【0034】そこで、以下の実施形態においては、IPOSデバイスを例とした大規模なシステム(以下、「IPOSシステム」という)に適したHW/SW協調設計について説明する。ただし、本発明は、必ずしもIPOSシステムだけでなく、従来のいわゆるシステムLSIなどの大規模な集積回路システムの設計にも適用が可能である。

#### 【0035】(実施形態)

##### —HW/SW協調設計全体の概略—

図2は、本発明の実施形態におけるHW/SW協調設計の概略的な手順を示すフロー図である。

【0036】ステップST1で、機能ライブリ(機能LIB)やテストベンチを用いて機能設計を行ない、ステップST2で、IP機能LIBを用いたIP機能設計を行なう。このステップST1、ST2では、半導体デバイスに搭載される各IPに要求される機能が例えばC言語により記述される。例えばJPEGの場合には、信号処理(アルゴリズム)だけが記載されているような状態である。

【0037】次に、ステップST3で、アーキテクチャモデルLIBを用いてシステムのアーキテクチャ設計を行なう。システムのアーキテクチャモデルLIBには、アーキテクチャモデルがシステムの設計に必要なHW、SWモデルとして存在しているので、このステップST3では、各モデルをバスに接続してシステム全体の概略的な構造を作り上げる。

【0038】次に、ステップST4で、各機能(機能ブロック)をアーキテクチャのコンポーネントに割り当てるマッピングを行なった後、ステップST5で、性能LIBを用いて性能解析を行ない、その結果、不具合があればステップST3のアーキテクチャ設計、又はステップST4のマッピングに戻り、性能が満足されるまでこれらのステップを繰り返すループ処理を行なう。

【0039】次に、ステップST6、ST7で、それぞれIPハードウェアモデルLIBを用いたHW設計と、例えばIPソフトウェアモデルLIBを用いたSW設計

とを個別に行なってから、HW及びSWが詳細化されると、ステップST8で、I/Fモデルを用いたHW/SW協調検証を行なう。その後、ステップST9で、実チップを用いて実チップの機能を確認するための実チップ検証を行なう。

#### 【0040】一機能設計及びIP機能設計—

図3は、機能設計を行なうステップST1と、IP機能設計を行なうステップST2との詳細な処理の内容を説明するための部分フロー図である。

【0041】ステップST1においては、以下の手順により、機能設計を行なう。機能LIBには、f1, f2, f3, f4などの種々の機能(function)が格納されている。この機能f1, f2, f3, f4とは、例えば画像処理におけるMPEGKL, JPEG, Bluetoothなどの機能である。また、テストベンチLIBには、tb1, tb2, tb3, tb4などの種々のテストベンチが格納されている。このテストベンチtb1, tb2, tb3, tb4は、機能設計が適正か否かを判断するための与えられるデータである。例えば、図3のステップST1中に示すように、機能f1, f2, f3を組み合わせたデザインがある場合には、入力テストベンチとして、テストベンチからtb1を取り出して、これを入力データとして与える。また、出力データとして例えば画像出力のテストベンチtb2を与える。その結果、ここで作り上げたデザインが適正かどうかがある程度検証される。

【0042】次に、ステップST2におけるIP機能設計は以下の手順で行なわれる。IP機能LIBには、各機能f1, f2, f3, f4ごとに、この機能を実現するためのいくつかのIPが格納されている。例えば、機能f1に対してf1-ip1~f1-ip4があり、機能f2に対してf2-ip1~f2-ip3があり、機能f3に対してf3-ip1, f3-ip2がある。そこで、およその見当をつけて、デザイン中の機能f1, f2, f3に対して用いるIPを指定する。例えば、機能f1に対してf1-ip4を、機能f2に対してf2-ip1を、機能f3に対してf3-ip2を用いるというようにパラメータを指定する。

【0043】次に、ステップST1で作り上げられたデザイン中の各機能f1, f2, f3に、それぞれf1-ip4, f2-ip1, f3-ip2を当てはめる。つまり、IP機能の選択を行なう。この段階では、選び出された各IPはいずれもステップST1における機能f1, f2, f3を有しているので、ステップST1で検証した結果と同じ結果が得られる。

【0044】このように、機能が互いに共通する複数のIPをLIBに格納しておいて、機能ごとに適当なIPを選択することにより、IPを代えても機能の同一性が保持されるので、従来大きかった設計変更の確率をできるだけ小さくすることができる。

【0045】次に、IP機能をさらに詳細に個々の機能に分けるIP機能の階層展開を行なう。例えば、f1-ip4について階層展開をすると、f1-ip4-A（例えば逆コサイン変換）を行なってからf1-ip4-B（例えば量子化）を行ない、その後f1-ip4-C（例えばハフマン符号化）を行なうという機能になっていたとする。つまり、IPであるf1-ip4を機能ブロックf1-ip4-A, f1-ip4-B, f1-ip4-Cに展開するのである。同様に、f2-ip1, f3-ip2についても階層展開を行なって、f2-ip1についてはf2-ip1-Aという機能ブロックが、f3-ip2についてはf3-ip2-A, f3-ip2-Bという機能ブロックがそれぞれ得られたとする。そして、この階層展開された各機能ブロックをデザイン中の各機能f1, f2, f3に置換する。この階層展開されたIPの中身をHW/SW分割するのが本発明の1つの特徴である。

#### 【0046】アーキテクチャ設計

次に、図4は、ステップST3における処理の内容を説明するための部分フロー図である。同図に示すように、アーキテクチャモデルL1bには、CPU, メモリ, ASIC（ロジック回路）, BUS, パスプリッジモデル, I/Fモデルなどのコンポーネント(c)についての多くの種類が格納されている。そこで、このコンポーネントごとに各種のコンポーネントパラメータをもっているので、コンポーネントパラメータの値を与える。つまり、CPUについては動作周波数, キャッシュヒット率があり、DRAMについては動作周波数, ビット幅があり、ASICについては動作周波数, ビット幅があり、BUSについてはバスクロック, バス幅, 転送レート(bus), アービトレーション方法があり、パスプリッジモデルについてはバスプリッジ間遅延があり、I/FモデルとしてUARTを選択したときには入出力転送レート(bps), 入出力ビット幅, 動作周波数, ビット幅がある。そして、各コンポーネントパラメータに具体的な値を入れる。そして、このパラメータ指定を行なってから、例えば図4に示すように、CPU1(c1), DRAM1(c2), ASIC1(c3), ASIC2(c6)及びUART(c5)をBUS1, BUS2及びバスプリッジ1(c4)を介して接続した構造を有するアーキテクチャを作り上げる。

【0047】ここで、このアーキテクチャの特徴は、複数のバス(BUS1, BUS2)を備え、BUS1-BUS2間を接続するバスプリッジ1(c4)をコンポーネントとして設けている点である。バスは3つ以上あってもよく、このような複数のバスを設けることにより、半導体デバイスのような半導体配線基板を有する構造に適したアーキテクチャを構築することができる。複数のバスの例としては、標準バスに低速バス、高速バスなどを別途設けたものが考えられる。そして、バスプリッジ

モデルを設けることにより、当該バスプリッジモデルに接続される2つのバスのビット幅が互いに異なる場合などにおいてもデータの円滑な転送を図ることができる。バスプリッジモデルの例としては、16ビット幅のBUS（例えばバス1）のデータを8ビットずつ別のBUS（例えばBUS2）に送り込むバッファがある。また、アーキテクチャにおいて、I/FモデルをASICとは別に設けたことにより、入出力の信号を取り扱うI/Fモデルにおける信号の遅延や消費電力を考慮したシステムの最適化が可能になる。

#### 【0048】マッピング

次に、図5は、ステップST4, ST5におけるマッピングと性能解析の概略とを説明するための部分フロー図である。

【0049】同図に示すように、ステップST4においては、ステップST2のIP機能設計によって得られたデザイン中の階層展開されたIPを、HWとSWとに割り当てる処理であるマッピングを行なう。例えば、テストベンチtb1は、HWとしてI/FモデルであるUARTに割り当てる。また、テストベンチtb2は、HWとしてDRAM1に割り当てる。また、階層展開されているf1-ip4中の機能ブロックf1-ip4-A(b11)はHWとしてASIC1に、機能ブロックf1-ip4-B(b12), 機能ブロックf1-ip4-C(b13)はSWとしてCPU1に、f2-ip1中の機能ブロックf2-ip1-A(b14)はSWとしてCPU1に、f2-ip2中の機能ブロックf2-ip2-A(b15), 機能ブロックf2-ip2-B(b16)はすべてHWとしてASIC2にそれぞれ割り当てる。

【0050】ここで、このマッピングの特徴は、テストベンチをI/Fモデルにマッピングしたことである。従来、単に入力信号として扱われていたテストベンチをHWであるI/Fモデルにマッピングすることにより、後の性能解析の際に遅延を考慮した処理時間の解析が可能になり、また、I/Fモデルが動作することを考慮した消費電力の解析が可能になる。つまり、解析精度の向上を図ることができる。

【0051】また、このように、1つのIPをHWとSWとにわけてマッピングができるようになったのは、IP機能設計において、上述のようにIPを機能ブロックのレベルまで階層展開したからである。そして、マッピングに応じて、図5の左下に示すように、各機能とデザイン中のコンポーネントとのマッピング対応表が機能番号(a1~an)とともに作成される。また、例えば機能ブロックf1-ip4-A→機能ブロックf1-ip4-Bというバスは、ASIC1→BUS1→(DRAM1→)CPU1というデータのバスとなり、機能ブロックf1-ip4-B→機能ブロックf1-ip4-Cというバスは、CPU1→(DRAM1→)CPU2と

いうデータのパスとなることが、ブロック間パステーブルとして作成され、設計装置の記憶装置（図示せず）に格納される。なお、括弧内のコンポーネントはその部分が経由される場合もあり、経由されない場合もあることを示している。

【0052】ここで、このように機能ブロック間パステーブルを作成することにより、後述するような動的な性能解析を精度よく行なうことができる。

【0053】次に、このようなマッピング結果を用いてステップST5における性能解析を行なう。このステップ\*10

$$\begin{aligned} \text{Cost-tot} = & k_1 (\text{Speed}_{\text{HW-tot}} + \text{Speed}_{\text{SW-tot}}) \\ & k_2 (\text{Area}_{\text{HW-tot}} + \text{Area}_{\text{SW-tot}}) \\ & k_3 (\text{Power}_{\text{HW-tot}} + \text{Power}_{\text{SW-tot}}) \end{aligned}$$

がある。ここで、 $k_1$ 、 $k_2$ 、 $k_3$ は重み係数であり、 $\text{Speed}_{\text{HW-tot}}$ はHW全体の処理速度であり、 $\text{Speed}_{\text{SW-tot}}$ はSW全体の処理速度であり、 $\text{Area}_{\text{HW-tot}}$ はHW全体の面積であり、 $\text{Area}_{\text{SW-tot}}$ はSW全体の面積であり、 $\text{Power}_{\text{HW-tot}}$ はHW全体の消費電力であり、 $\text{Power}_{\text{SW-tot}}$ はSW全体の消費電力である。つまり、この例では、パラメータである処理速度ができるだけ大きく、面積ができるだけ小さく、消費電力ができるだけ小さくなるようにシステムを構築したいと考えていることにな。

$$\begin{aligned} \text{Speed}_{\text{HW-tot}} & (f_{b11} \sim f_{b16}, f_{bus}, R_{bus}, P_{b11} \sim P_{b16}) \\ & = \text{Speed}_{\text{HW-b11}} (f_{b11}, f_{bus}, R_{bus}, R_{b11}) + \\ & \cdots + \text{Speed}_{\text{HW-b16}} (f_{b16}, f_{bus}, R_{bus}, R_{b16}) \end{aligned} \quad (2)$$

のように行なわれる。ここで、式(2)において、図5に示すように、マッピングしたときの機能ブロック番号をb11～b16とし、コンポーネント番号をc1～c6とする。そして、 $f$ は動作周波数であり、 $R$ はバスの転送レートであり、 $P$ は機能のバスに対する優先順位(優先度)（0～1の値）を表している。この優先順位★

$$\begin{aligned} \text{Speed}_{\text{HW-b11}} & (f_{b11}, f_{bus}, R_{bus}, P_{b11}) \\ & = 1 / (f_{b11} \times f_{bus} \times R_{bus} \times P_{b11}) \end{aligned} \quad (3)$$

のよう求められる。つまり、処理速度はできる限り小さい方が好ましいことから、動作周波数 $f$ 、転送レート $R$ 、優先順位 $P$ の逆数からコスト関数(Cost-tot)のうち処理速度Speedの成分を計算する。★

$$\begin{aligned} \text{Speed}_{\text{SW-tot}} & (S_{t_{\text{CPU-01}}} \sim S_{t_{\text{CPU-05}}}, f_{\text{CPU}}) \\ & = \text{Speed}_{\text{SW-b11}} (S_{t_{\text{CPU-01}}}, f_{\text{CPU}}) + \\ & \cdots + \text{Speed}_{\text{SW-b16}} (S_{t_{\text{CPU-05}}}, f_{\text{CPU}}) \end{aligned} \quad (4)$$

により求められる。この計算の考え方は以下の通りである。機能ブロックをfunctionによって表すと、処理はC言語によって記述することができ、C言語で記述すればアセンブリ言語にコンパイルすることが可能となる。したがって、アセンブリのステップ数で処理速度◆

$$\text{Speed}_{\text{SW-b11}} (S_{t_{\text{CPU-01}}}, f_{\text{CPU}}) = S_{t_{\text{CPU-01}}} \times f_{\text{CPU}} \quad (5)$$

のよう求められる。このステップ数が小さいほど速度が大きいので、式(5)の数値がなるべく小さいことが望ましいことになる。

$$\text{Area}_{\text{HW-tot}} = \text{Area}_{\text{HW-b11-b16}}$$

\* プにおいては、静的解析と動的解析とを行なってもよいし、静的解析及び動的解析のうちいずれか一方のみを行なってよい。

#### 【0054】一性能解析(静的解析)

性能解析のうち静的解析は、例えば所望のパラメータを変数としてシステム全体のコスト関数(Cost-tot)を定義して、このコスト関数(Cost-tot)を求める。そして、コスト関数(Cost-tot)が最小又はある上限値以下になるかを目標として設計を進める。このコスト関数(Cost-tot)の一例として、例えば下記式(1)

(1)

※る。そこで、コスト関数(Cost-tot)は小さいほどよいとする。例えば、各種のマッピングMAP1、MAP2、MAP3を行なった結果、コスト関数(Cost-tot)が図6に示す値になったとする。このときには、もっとも値が小さいマッピングMAP1が最適であると判断する。

【0055】ここで、例えば処理速度に関する計算は、マッピング結果を用いて、下記式(2)

★ Pは、バスに接続されるすべてのコンポーネントの優先度を合計すると1になるように設定されている。

【0056】すると、式(2)中の例えば機能ブロックb11( $f_{b11} - i_{p4-A}$ )の処理速度は、下記式(3)

★ 【0057】次に、式(1)中のSWについての処理速度成分Speed<sub>SW-tot</sub>は、マッピングのブロック間パステーブルに基づいて、下記式(4)

◆を演算することができるからである。

【0058】ここで、すると、式(4)中の例えば機能ブロックb11( $f_{b11} - i_{p4-A}$ )の処理速度は、下記式(5)

【0059】次に、面積に関する計算は、マッピング結果を用いて、下記式(6)

$$+ \text{Area}_{HW-IP-1} + \text{Area}_{HW-IP-2}$$

のように行なわれる。つまり、IP機能を選択した後でIP機能の階層展開を行なう前に使用される各IP (f1-ip4, f2-ip1, f3-ip2) の情報があるので、これからHW部分の面積を求めることができる。

【0060】次に、機能ブロックをコンパイルすると、\*

$$\text{Area}_{SW-tot} = (\text{Msize}_{SW-b1} + \dots + \text{Msize}_{SW-b8}) \times \text{Area}_{DRAM} \quad (7)$$

により、求めることができる。

【0061】このように、IP内が機能ブロックに分割されたことにより、機能ブロックのSWの部分からメモリサイズを計算すると、各機能ブロック間で面積を重複

$$\text{Power}_{HW-tot} = \text{Power}_{HW-b1} + \dots + \text{Power}_{HW-b8} \quad (8)$$

のように行なわれる。すると、式(8)中の例ええば機能ブロック b11 (f1-ip4-A) の消費電力は、下★

$$\begin{aligned} \text{Power}_{HW-b11} & (f_{11}, V_{11}) \\ & = \alpha_{b11} \times f_{11} \times (V_{11})^2 \times P_{11} \end{aligned}$$

により、表される。ただし、 $\alpha$ は機能ブロック b11 のパワー係数でIP性能 L1b から抽出されるもの、 $f_{11}$  はコンポーネント c3 (ASIC1) の動作周波数、 $V_{11}$  はコンポーネント c3 (ASIC1) の電圧、 $P_{11}$  はコンポーネント c3 (ASIC1) の優先順位 (優先

$$\text{Power}_{SW-tot} = \text{Power}_{SW-CPU-tot} + \text{Power}_{SW-DRAM-tot} \quad (10)$$

により求められる。式(10)の第1項は、

$$\text{Power}_{SW-CPU-tot} = \alpha_{CPU} \times f_{CPU} \times \text{Load}_{CPU}$$

となる。ここで、 $\alpha_{CPU}$  はCPUのパワー係数でIP性能 L1b から抽出されるもの、 $\text{Load}_{CPU}$  はCPUロード (0~1) であって、「SWにマッピングされた機能ブロックのメモリサイズの合計 (b11)」を「すべての◆

$$\text{Power}_{SW-DRAM-tot} = \alpha_{DRAM} \times f_{DRAM} \times (V_{DRAM})^2 \times P_{DRAM} \quad (12)$$

となる。 $\alpha_{DRAM}$  はDRAMのパワー係数でIP性能 L1b から抽出されるもの、 $f_{DRAM}$  はDRAMの動作周波数 (Hz)、 $V_{DRAM}$  はDRAMの電圧、 $P_{DRAM}$  はDRAMの優先順位を示している。この優先度を用いることで、トグル数がわからない静的解析においても、ある程度の精度で消費電力が求まることになる。

【0065】そして、以上の計算を行なって上で、式(1)から最終的に決定されるコスト関数 (Cost-tot) が最小になるか、下限値以下になったときに静的解析に関する限り、設計されたシステムが適切であると判断する。

【0066】一性能解析 (動的解析) -

動的解析においては、面積 Area については静的解析と同じであるので、処理速度 Speed と消費電力 Power のみを求める。動的解析においては、設計システムに実際にデータを入力させて動作させるシミュレーションを行なう。したがって、実行時間 (Time (sec)) や、各機能ブロックの入出力データ、トグル率 (5) がシミュレーションから得られる。

【0067】そこで、動的解析においては、基本的に

\* アセンブラーでメモリサイズがわかるので、SWのメモリの部分をすべて加算しておいて、それにエリアDRAMというデータベースを用いてDRAMの1ビット当たりの面積 (単価) を計算する。それに、メモリサイズを乗じると、下記式 (7)

$$\text{Area}_{SW-tot} = (\text{Msize}_{SW-b1} + \dots + \text{Msize}_{SW-b8}) \times \text{Area}_{DRAM} \quad (7)$$

※して計算する場合があるので、これを考慮して面積の計算精度の悪化を防止するのである。

【0062】次に、HW部分の消費電力に関する計算は、マッピング結果を用いて、下記式 (8)

$$\text{Power}_{HW-tot} = \text{Power}_{HW-b1} + \dots + \text{Power}_{HW-b8} \quad (8)$$

★記式 (9)

☆度) を示している。この優先度をトグル数の代わりに用いることで、トグル数がわからない静的解析においても、ある程度の精度で消費電力が求まることになる。

【0063】また、SW部分の消費電力に関する計算は、下記式 (10)

$$(10)$$

◆機能ブロックをSWにマッピングしたときのメモリサイズの合計 (b11) で除したものである。

【0064】一方、式(10)の第2項は、

$$\text{Power}_{SW-DRAM-tot} = \alpha_{DRAM} \times f_{DRAM} \times (V_{DRAM})^2 \times P_{DRAM} \quad (12)$$

は、この得られた要素を上記式 (1) ~ (12) に代入することにより、コスト関数 (Cost-tot) の値を求めることができる。その際、式(1)における (Speed<sub>HW-tot</sub> + Speed<sub>SW-tot</sub>) は、シミュレーションで得られた時間 Time に置き換えることができ、式(9)における各コンポーネントの優先順位 P はシミュレーションで得られた各コンポーネントのトグル数で置き換えることができる。そして、式(11)における CPUロード Load<sub>CPU</sub> は、実際のシミュレーションから求まる平均ロード (5) を用いる。

【0068】さらに、式(12)におけるDRAMの優先順位 P (優先度) はシミュレーションで得られたDRAMのトグル数で置き換えることができる。

【0069】-HW/SW分割 (静的分割) -  
次に、ステップ ST4, ST5 と共に行なわれる IP 内の HW/SW 分割について説明する。HW/SW には静的分割と動的分割とがあるが、まず、静的な分割について説明する。

【0070】図 7 は、静的な HW/SW 分割を説明するための図である。同図に示すように、半導体デバイスな

どのシステムに利用されるハードIPには、機能A、機能B、機能C、機能Dがあり、かつ、これらの機能のON・OFFを設定するための設定レジスタがある。ただし、HW/SW分割における「機能」とは本実施形態における「機能ブロック」を意味している。一方、IP性能Libには、各機能A、機能B、機能C、機能DについてのSWモデルが例えばC/C++言語によって記述されて格納いる。このとき、各機能をHWとSWとによって動作させた結果、1つの機能を変更、修正、削除する必要が生じる場合がある。ここで、例えば、設定レジスタ内の機能DをOFFにすることで、例えば機能Dへのクロックの供給を停止するなどの制御を行なって、機能Dが動作しないようにすることができる。これにより、無駄な電力の消費を抑制して消費電力の低減を図ることができる。また、各機能A～D間の接続を変更することもできる。

【0071】さらに、例えば1つの機能DをHWからIP性能Libに用意されたSWモデルに切り換えたり、用意しているLib内のSWモデルを修正することもできる。つまり、いずれかのLib内に各機能と等価なSWモデルを準備しておくことにより、1つのIP内をHW/SW分割することができ、ハードIPの機能が不足したときにも設計を進めることができる。また、SWの機能を修正、追加することにより、システムの変更に柔軟に対応することができる。

#### 【0072】－動的なHW/SW分割－

次に、動的なHW/SW分割について説明する。図7に示すHW/SW分割は、HW、SWの設定を行なった後は、原則としてその後の修正は行なわない。それに対し、動的なHW/SW分割、つまりHW/SW動作の切り換えにおいては、機能（機能ブロック）が動作しながら柔軟に変更、追加、修正を受けることができる。このような動的なHW/SW分割の例として、以下、第1～第3の具体例について説明する。

#### 【0073】1. 第1の具体例

第1の具体例では、図7において、各機能のON、OFFをSWによって制御し、かつ、停止させる場合はIP性能Libから同等のSWモデルを呼びだしてこれを用いる。設定レジスタへの制御信号により、各機能を動作させながらHW/SWの切り換えを行なうことができる。

#### 【0074】2. 第2の具体例

図8(a)、(b)は、動的なHW/SWの切り換えにおける消費電力Powerのタイムチャート図である。また、図9は、このHW/SWの切り換え制御のためのプログラムの例をC言語で示す図である。図9に示すように、設定レジスタの制御により、ハードIPの機能Cを動作させた場合に、図8(a)に示すように、IPの消費電力Powerが消費電力の上限値MAXpowerを越える時があるとする。動的解析からどの機能が動作している

かが時間軸に応じてわかるので、あるレジスタに各機能の消費電力の合計を計算しながら書き込んでおいて、その値が上限値MAXpowerを超えるときを検出すればよい。そして、IPの消費電力Powerが消費電力の上限値MAXpowerを超えると、図9に示すように、設定レジスタの制御によりハードIPの機能CをOFFにして、代わりにSWモデルからfunc-Cを呼び出してこちらを動作させる。これにより、図8(b)に示すように、消費電力Powerが上限値MAXpowerを超えることがなくなり、所望の制約条件の下での作動を確保することができる。つまり、この例では、当該IPの機能A、Cが動作する期間には機能CがSWによって実現にされるが、機能A、B、Cが動作する期間には機能CがHWによって実現されるうに設計することになる。

#### 【0075】3. 第3の具体例

図10(a)、(b)は、動的なHW/SWの切り換えにおける処理速度Speedの消費電力依存性を示す図である。また、図11は、このHW/SWの切り換え制御のためのプログラムの例をC言語で示す図である。図11に示すように、(注:不等号の向きが逆のように思われましたので変更いたしましたが、どうでしょうか)CPUの設定レジスタの制御により、CPUのロード(%)がある値IDLEよりも大きいときには機能CをSWにより実行し、CPUのロード(%)がある値IDLE以下のときに機能CをHWにより実行するよう制御する。つまり、機能Cを常にHWで実行すると、図10(a)に示すように処理時間Timeが上限値MAXtimeを越える事態が発生する。そこで、レジスタにCPUのロード(%)を検知しながら書き込んでおいて、CPUのロード(%)が下限値IDLEを越えるときを検出しながら、CPUのロード(%)がある値IDLE以下のときには機能CをHWにより実行する。そして、CPUのロード(%)が下限値IDLEを越えると、設定レジスタの制御によりハードIPの機能CをOFFにして、代わりにSWモデルからfunc-Cを呼び出してSWを動作させる。このような制御を行なうことにより、図10(b)に示すように、処理時間Timeが上限値MAXtimeを越えることがなくなり、所望の制約条件の下での作動を確保することができる。

#### 【0076】－HW/SW協調検証－

次に、ステップST8の協調検証について説明する。上述のステップST4のマッピング処理、ステップST5の性能解析処理に基づいて最終的に決定されたHW、SWの構成に従い、ステップST6、ST7で、HW設計とSW設計とを行なって、HWモデルとSWモデルとをそれぞれ作成する。HWモデルを作成する際にはIPハードウェアモデルLib(BCA, RTL又はゲートレベルで記述)を利用し、SWモデルを作成する際にはIPソフトウェアモデルLib(C言語、C++言語又はアセンブラーで記述)を利用する。

【0077】次に、ステップST8では、ステップST6, ST7で作成したHWモデル及びSWモデルを利用して、HW/SW協調検証を行なうが、そのためにはHW-SW間のI/Fモデルが必要となる。そこで、以下の手順により、I/Fモデルモデルを作成する。

【0078】まず、図13に示すようなメモリマップを作成する。このメモリマップは、SWにプログラムをコンパイルしたものである。HWは、レジスタをメモリにマッピングする。

【0079】そして、各機能ブロックのアドレスを決定し、各機能ブロックのアドレステーブルをデータベース化して、メモリマップDBに登録する。そして、図14に示すように、メモリマップDBに登録されたHWのレジスタとアドレスとの対応表をとりだして、アドレスデコーダを作成する。

【0080】バスコントローラは、各HWブロックのP(優先度)にしたがって、各バス毎のアービトレーション方法ごとに用意したHDLテンプレートを生成する。すなわち、バスコントローラは、各ハードウェアのレジスタアドレスをメモリマップDBから抽出して、関数を作成し、これをドライバー関数テンプレートとしてSWモデルに格納する。

【0081】図15は、基本ハードウェアアクセス用のドライバー関数テンプレートの一例を示す図である。このようなメモリマップDB、アドレスデコーダ、関数テンプレートを利用することにより、設計されたシステムのHWによってSWを動作させたり、システムのSWによってHWを動作させることができ、HW/SW協調検証を行なうことができる。

#### 【0082】

【発明の効果】本発明により、IPの機能に着目してより最適化された半導体集積回路装置を形成するための設計が可能になった。

#### 【図面の簡単な説明】

【図1】(a), (b), (c)は、IP群を搭載するための配線基板となるシリコン配線基板の平面図、シリコン配線基板上に搭載されるIP群の例を示す平面図、及びシリコン配線基板の断面図である。

\* 【図2】本発明の実施形態におけるHW/SW協調設計の概略的な手順を示すフロー図である。

【図3】機能設計とIP機能設計との詳細な処理の内容を説明するための部分フロー図である。

【図4】システムアーキテクチャ設計における処理の内容を説明するための部分フロー図である。

【図5】マッピングと性能解析の概略とを説明するための部分フロー図である。

【図6】各種のマッピングを行なった結果のコスト関数(Cost-tot)の値の例を示す図である。

【図7】静的なHW/SW分割を説明するための図である。

【図8】(a), (b)は、動的なHW/SWの切り換えにおける消費電力Powerのタイムチャート図である。

【図9】消費電力を考慮したHW/SWの切り換え制御のためのプログラムの例をC言語で示す図である。

【図10】(a), (b)は、動的なHW/SWの切り換えにおける処理速度Speedの消費電力依存性を示す図である。

【図11】処理速度を考慮したHW/SWの切り換え制御のためのプログラムの例をC言語で示す図である。

【図12】(a), (b)は、第2の実施形態の第5の具体例における機能の設定に関する半導体デバイスの構成を示す斜視図及びブロック回路図である。

【図13】SWにプログラムをコンパイルして得られたメモリマップを示す図である。

【図14】メモリマップDBに登録されたHWのレジスタとアドレスとの対応表をとりだして、アドレスデコーダを作成する処理を示す図である。

【図15】基本ハードウェアアクセス用のドライバー関数テンプレートの一例を示す図である。

#### 【符号の説明】

10 シリコン配線基板

11 シリコン基板

12 グランドプレーン

13 第1配線層

14 第2配線層

15 パッド

【図6】

|          | MAP1 | MAP2 | MAP3 |
|----------|------|------|------|
| Cost-tot | 80   | 100  | 103  |

【図9】

```
if(Power(new) > MAXpower)
{
    regC=ON;
} else{
    regC=OFF;
    func_C( );
}

```

【図11】

```
if_Load cpu>IDLE
{
    regC=OFF;
    func_C( );
} else{
    regC=ON;
}

```

【図13】



[图 1]



【図2】



[图 4]

[图 7]



[図14]



アーキテクチャモジュールLib

|                                     |                                                 |                                              |
|-------------------------------------|-------------------------------------------------|----------------------------------------------|
| CPUモジュール<br>-CPU1<br>-CPU2<br>-CPU3 | メモリモジュール<br>-DRAM<br>-SRAM<br>-フラッシュメモリ<br>-ROM | ASICモジュール<br>-ASIC1<br>-ASIC2                |
| BUSモジュール<br>-BUS1<br>-BUS2<br>-BUS3 | ペーストライプモジュール<br>-ペーストライプ1<br>-ペーストライプ2          | I/Fモジュール<br>-UART<br>-IEEE1394<br>-Bluetooth |

システム  
アーキテクチャ設計

ST3

パラメータ指定

| アーキテクチャモジュール | 種類                   | プロットパラメータ                       |
|--------------|----------------------|---------------------------------|
| CPUモジュール     | CPU1                 | 動作周波数<br>・キャッシュヒット率             |
| メモリモジュール     | DRAM                 | 動作周波数<br>・入出力ビット幅               |
| ASICモジュール    | ASIC1<br>ASIC2       | 動作周波数<br>・入出力ビット幅               |
| BUSモジュール     | BUS1<br>BUS2         | ・バス幅<br>・転送レート<br>・アービレーション方法   |
| ペーストライプモジュール | ペーストライプ1<br>ペーストライプ2 | ・ペースト幅<br>・転送レート                |
| I/Fモジュール     | UART                 | ・入出力転送レート<br>・入出力ビット幅<br>・動作周波数 |

〔四三〕



[图 5]



[图 81]



[图1.9]



【図12】



## 【手続補正書】

【提出日】平成13年10月2日(2001.10.2)

## 【手続補正1】

【補正対象書類名】明細書

【補正対象項目名】全文

【補正方法】変更

【補正内容】

【書類名】明細書

【発明の名称】半導体集積回路装置の設計方法

【特許請求の範囲】

【請求項1】共通の機能を有する複数のIPを、複数の機能について記憶装置に格納するステップ(a)と、ある仕様を満たすための機能群構造を構築するステップ(b)と、

上記記憶装置から上記機能群構造中の各機能について、当該機能を共通に有する複数のIPから1つのIPを選択して取り出して、上記機能群構造中の各機能と置き換えるステップ(c)とを含む半導体集積回路装置の設計方法。

【請求項2】請求項1記載の半導体集積回路装置の設計方法において、

上記各機能ごとに、当該機能の実現対象をデータベースのアーキテクチャモデル中のHWモデルとSWモデルとに割り当てるよう分割するステップ(e)とをさらに含むことを特徴とする半導体集積回路装置の設計方法。

【請求項3】請求項2記載の半導体集積回路装置の設

計方法において、

上記ステップ(c)の後、上記IPの階層を機能プロックレベルに展開するステップ(d)をさらに含み、

上記ステップ(e)では、上記展開された各機能プロックごとに、当該機能プロックの実現対象をアーキテクチャモデル中のHWモデルとSWモデルとに割り当てるこを特徴とする半導体集積回路装置の設計方法。

【請求項4】各々ある機能を有する複数のIPを記憶装置に格納するステップ(a)と、

ある仕様を満たすための機能群構造を構築するステップ(b)と、

上記記憶装置から上記機能群構造中の各機能について、当該機能を有するIPを選択して取り出して、上記機能群構造中の各機能と置き換えるステップ(c)と、上記IPを機能プロックレベルに階層展開するステップ(d)と、

上記階層展開された各機能プロックごとに、当該機能プロックの実現化対象をデータベースのアーキテクチャモデル中のHW(ハードウェア)モデルとSW(ソフトウェア)モデルとに割り当てるよう分割するステップ(e)とを含む半導体集積回路装置の設計方法。

【請求項5】請求項4記載の半導体集積回路装置の設計方法において、

上記ステップ(e)では、機能プロックのHWの部分から面積の重複を考慮した静的解析を行なうことを特徴とする半導体集積回路装置の設計方法。

【請求項6】 請求項4記載の半導体集積回路装置の設計方法において、

上記ステップ(e)の後、割り当てられた上記機能群構造中の各機能ブロックのHWモデルとSWモデルとへの割り当てを決定するための動的性能解析を行なうステップ(f)をさらに含むことを特徴とする半導体集積回路装置の設計方法。

【請求項7】 請求項6記載の半導体集積回路装置の設計方法において、

上記データベースには、HWの機能毎に当該HWと等価な機能を有するSWモデルを格納しておくことを特徴とする半導体集積回路装置の設計方法。

【請求項8】 請求項7記載の半導体集積回路装置の設計方法において、

上記ステップ(f)では、時間軸に沿って消費電力が常に上限値を超えないように各機能ブロックのHWモデルとSWモデルとへの割り当てを切り換えることを特徴とする半導体集積回路装置の設計方法。

【請求項9】 請求項6記載の半導体集積回路装置の設計方法において、

上記ステップ(f)では、ある機能ブロックをHWに割り当てたときのCPUの負荷率がある下限値よりも小さいときは、当該機能ブロックの割り当てをSWに切り換えることを特徴とする半導体集積回路装置の設計方法。

【請求項10】 請求項5～9のうちいずれか1つに記載の半導体集積回路装置の設計方法において、

上記ステップ(e)では、メモリの消費電力を考慮した解析を行なうことを特徴とする半導体集積回路装置の設計方法。

【請求項11】 複数のHWのコンポーネントをアーキテクチャモデルとして記憶装置に格納するステップ(a)と、

上記記憶装置からアーキテクチャモデルをコンポーネント群として取り出して、このコンポーネント群によりある仕様を満たすアーキテクチャを構築するステップ(b)とを含み、

上記ステップ(b)では、コンポーネント群に複数のバスと各バス間を接続するバスブリッジモデルとが含まれるように上記アーキテクチャを構築することを特徴とする半導体集積回路装置の設計方法。

【請求項12】 請求項11記載の半導体集積回路装置の設計方法において、

上記ステップ(b)では、上記バスブリッジモデルが、バス幅が互いに異なる2つのバス間をバス幅及びデータ転送速度を調整するように接続していることを特徴とする半導体集積回路装置の設計方法。

【請求項13】 複数のHWのコンポーネントをアーキテクチャモデルとして記憶装置に格納するステップ(a)と、

上記記憶装置からアーキテクチャモデルをコンポーネン

ト群として取り出して、このコンポーネント群によりある仕様を満たすアーキテクチャを構築するステップ(b)と、

上記仕様を満たすための機能群構造を構築するステップ(c)と、

上記機能群構造の入力側及び出力側にテストベンチを付設するステップ(d)と、

上記機能群構造中の機能及びテストベンチを上記アーキテクチャ中のコンポーネントに割り当てるステップ(e)とを含む半導体集積回路装置の設計方法。

【請求項14】 請求項13記載の半導体集積回路装置の設計方法において、

上記ステップ(a)では、上記複数のコンポーネントの中にI/Fモデルを含めておき、

上記ステップ(b)では、上記コンポーネント群にI/Fモデルを含めるように上記アーキテクチャを構築することを特徴とする半導体集積回路装置の設計方法。

【請求項15】 請求項14記載の半導体集積回路装置の設計方法において、

上記ステップ(e)では、上記入力側又は出力側のテストベンチを上記アーキテクチャ中のI/Fモデルに割り当てる特徴とする半導体集積回路装置の設計方法。

【請求項16】 請求項13～15のうちいずれか1つに記載の半導体集積回路装置の設計方法において、

上記ステップ(a)では、上記複数のコンポーネントの中にメモリ含めておき、

上記ステップ(b)では、上記コンポーネント群にメモリを含めるように上記アーキテクチャを構築し、

上記ステップ(e)では、上記入力側又は出力側のテストベンチを上記アーキテクチャ中のメモリに割り当てる特徴とする半導体集積回路装置の設計方法。

【請求項17】 各々ある機能を有する複数のIPを記憶装置に格納するステップ(a)と、

ある仕様を満たすための機能群構造を構築するステップ(b)と、

上記記憶装置から上記機能群構造中の各機能について、当該機能を有するIPを選択して取り出して、上記機能群構造中の各機能と置き換えるステップ(c)と、

上記IPを機能ブロックレベルに階層展開するステップ(d)と、

上記階層展開された各機能ブロックをアーキテクチャモデル中のコンポーネントに割り当てるステップ(e)と、

上記機能ブロックから当該機能ブロックの出力を受ける他の機能ブロックまでの経路を、上記アーキテクチャモデル中のコンポーネント間の経路として記述する機能ブロック間テーブルを作成するステップ(f)とを含む半導体集積回路装置の設計方法。

【請求項18】 各々ある機能を有する複数のIPを記

憶装置に格納するステップ (a) と、ある仕様を満たすための機能群構造を構築するステップ (b) と、上記記憶装置から上記機能群構造中の各機能について、当該機能を有するIPを選択して取り出して、上記機能群構造中の各機能と置き換えるステップ (c) と、上記機能群中の各機能をデータベースのアーキテクチャモデル中のコンポーネントに割り当てるステップ (e) と、上記コンポーネントのバスアクセスのための優先度を設定するステップ (f) と、上記機能群構造の各機能が上記コンポーネントに割り当てられた状態で上記機能群構造の静的な性能解析を行うステップ (g) とを含み、上記静的な性能解析においては、上記各コンポーネントのアーキテクチャモデル中におけるバスアクセスの優先度をトグル数と見なして上記機能群構造の消費電力を計算することを特徴とする半導体集積回路装置の設計方法。

【発明の詳細な説明】

【0001】

【発明の属する技術分野】本発明は、複数の機能を有する回路を複数個配置した半導体集積回路装置の設計方法に関する。

【0002】

【従来の技術】近年、複数のLSIを共通の基板上に形成したシステムLSIという概念が提起されており、システムLSIの設計手法としても各種の提案がなされている。特に、システムLSIの利点は、DRAMなどのメモリや、ロジックLSIや、高周波回路などのアナログ回路を1つの半導体装置内に収納して、多種、多機能の半導体装置を極めて高集積化して実現することができる。

【0003】

【発明が解決しようとする課題】ところで、上記従来のシステムLSIにおいては、システムLSIを設計する際に、IP、コアと呼ばれる設計資産を利用することが多い。そのとき、各コアは個別に設計されたものなので、これらを統合したときには必ずしも円滑な動作が得られないことがある。しかし、従来のコア又はIPは、その中身がブラックボックスとなっているので、円滑な動作を確保するシステムを設計するためには多大の手間と時間とを要しているのが現実である。

【0004】本発明の目的は、IPの機能の同一性を図りつつIPの選択を柔軟に行なうための手段を講ずることにより、最適化が容易な半導体集積回路装置の設計方法の提供を図ることにある。

【0005】

【課題を解決するための手段】本発明の第1の半導体集積回路装置の設計方法は、共通の機能を有する複数のIP

を、複数の機能について記憶装置に格納するステップ (a) と、ある仕様を満たすための機能群構造を構築するステップ (b) と、上記記憶装置から上記機能群構造中の各機能について、当該機能を共通に有する複数のIPから1つのIPを選択して取り出して、上記機能群構造中の各機能と置き換えるステップ (c) とを含んでいる。

【0006】この方法により、機能が互いに共通する複数のIPをLIBに格納しておいて、機能ごとに適当なIPを選択することができるので、IPを代えても機能の同一性が保持される。したがって、従来大きかった設計変更の確率をできるだけ小さくすることができる。

【0007】上記各機能ごとに、当該機能の実現対象をデータベースのアーキテクチャモデル中のHWモデルとSWモデルとに割り当てるよう分割するステップ (e) とをさらに含むことにより、最適化された半導体集積回路装置を設計することができる。

【0008】上記ステップ (c) の後、上記IPの階層を機能ブロックレベルに展開するステップ (d) をさらに含み、上記ステップ (e) では、上記展開された各機能ブロックごとに、当該機能ブロックの実現対象をアーキテクチャモデル中のHWモデルとSWモデルとに割り当てるにより、より最適化された半導体集積回路装置を設計することができる。

【0009】本発明の第2の半導体装置集積回路装置の設計方法は、各々ある機能を有する複数のIPを記憶装置に格納するステップ (a) と、ある仕様を満たすための機能群構造を構築するステップ (b) と、上記記憶装置から上記機能群構造中の各機能について、当該機能を有するIPを選択して取り出して、上記機能群構造中の各機能と置き換えるステップ (c) と、上記IPを機能ブロックレベルに階層展開するステップ (d) と、上記階層展開された各機能ブロックごとに、当該機能ブロックの実現化対象をデータベースのアーキテクチャモデル中のHWモデルとSWモデルとに割り当てるよう分割するステップ (e) とを含んでいる。

【0010】このように、IPを階層展開してからHWモデルとSWモデルとに分割することにより、IP内をHWモデルとSWモデルとに区別してマッピングを行なうことが可能となり、IP毎にマッピングする場合に比べて、より最適化されたシステムの設計が可能になる。

【0011】上記ステップ (e) では、機能ブロックのHWの部分から面積の重複を考慮した静的解析を行なうことにより、面積の計算精度の悪化を防止することができる。

【0012】上記ステップ (e) の後、割り当てられた上記機能群構造中の各機能ブロックのHWモデルとSWモデルとの割り当てを切り換える動的性能解析を行なうステップ (f) をさらに含むことにより、解析精度の向上を図ることができる。

【0013】上記データベースには、HWの機能毎に当該HWと等価な機能を有するSWモデルを格納しておくことが好ましい。

【0014】上記ステップ(f)では、時間軸に沿って消費電力が常に上限値を超えないよう各機能ブロックのHWモデルとSWモデルへの割り当てを切り換えることができる。

【0015】上記ステップ(f)では、ある機能ブロックをHWモデルに割り当てたときのCPUの負荷率がある下限値よりも小さいときは、当該機能ブロックの割り当てをSWに切り換えることもできる。

【0016】上記ステップ(e)では、メモリの消費電力を考慮した解析を行なう。

【0017】本発明の第3の半導体装置集積回路装置の設計方法は、複数のHWのコンポーネントをアーキテクチャモデルとして記憶装置に格納するステップ(a)と、上記記憶装置からアーキテクチャモデルをコンポーネント群として取り出して、このコンポーネント群によりある仕様を満たすアーキテクチャを構築するステップ(b)とを含み、上記ステップ(b)では、コンポーネント群に複数のバスと各バス間を接続するバスプリッジモデルとが含まれるように上記アーキテクチャを構築する方法である。

【0018】このような複数のバスを設けることにより、IPOSデバイスのような半導体配線基板を有する構造に適したアーキテクチャを構築することができる。

【0019】上記ステップ(b)では、上記バスプリッジモデルが、バス幅が互いに異なる2つのバス間をバス幅及びデータ転送速度を調整するように接続していることにより、当該バスプリッジモデルに接続される2つのバスのバス幅やデータ転送速度が互いに異なる場合などにおいてもデータの円滑な転送を図ることができる。

【0020】本発明の第4の半導体装置集積回路装置の設計方法は、複数のHWのコンポーネントをアーキテクチャモデルとして記憶装置に格納するステップ(a)と、上記記憶装置からアーキテクチャモデルをコンポーネント群として取り出して、このコンポーネント群によりある仕様を満たすアーキテクチャを構築するステップ(b)と、上記仕様を満たすための機能群構造を構築するステップ(c)と、上記機能群構造の入力側及び出力側にテストベンチを付設するステップ(d)と、上記機能群構造中の機能及びテストベンチを上記アーキテクチャ中のコンポーネントに割り当てるステップ(e)とを含んでいる。

【0021】この方法により、テストベンチをHWにマッピングすることが可能になり、性能解析などにテストベンチの入出力に要する時間などのパラメータを含めることができる。

【0022】上記ステップ(a)では、上記複数のコンポーネントの中にI/Fモデルを含めておき、上記ステ

ップ(b)では、上記コンポーネント群にI/Fモデルを含めるように上記アーキテクチャを構築することにより、入出力の信号を取り扱うI/Fモデルにおける信号の遅延や消費電力を考慮したシステムの最適化が可能になる。

【0023】上記ステップ(e)では、上記入力側のテストベンチを上記アーキテクチャ中のI/Fモデルに割り当てることにより、従来、単に入力信号として扱われていたテストベンチがHWであるI/Fモデルにマッピングされるので、後の性能解析の際に遅延を考慮した処理時間の解析が可能になり、また、I/Fが動作することを考慮した消費電力の解析が可能になる。つまり、解析精度の向上を図ることができる。

【0024】上記ステップ(a)では、上記複数のコンポーネントの中にメモリ含めておき、上記ステップ(b)では、上記コンポーネント群にメモリを含めるように上記アーキテクチャを構築し、上記ステップ(e)では、上記出力側のテストベンチを上記アーキテクチャモデル中のメモリに割り当てることもできる。

【0025】本発明の第5の半導体装置集積回路装置の設計方法は、各々ある機能を有する複数のIPを記憶装置に格納するステップ(a)と、ある仕様を満たすための機能群構造を構築するステップ(b)と、上記記憶装置から上記機能群構造中の各機能について、当該機能を有するIPを選択して取り出して、上記機能群構造中の各機能と置き換えるステップ(c)と、上記IPを機能ブロックレベルに階層展開するステップ(d)と、上記階層展開された各機能ブロックをアーキテクチャ中のコンポーネントに割り当てるステップ(e)と、上記機能ブロックから当該機能ブロックの出力を受ける他の機能ブロックまでの経路を、上記アーキテクチャ中のコンポーネント間の経路として記述する機能ブロック間テーブルを作成するステップ(f)とを含んでいる。

【0026】このように機能ブロック間パステーブルを作成することにより、動的な性能解析を精度よく行なうことができる。

【0027】本発明の第6の半導体装置集積回路装置の設計方法は、各々ある機能を有する複数のIPを記憶装置に格納するステップ(a)と、ある仕様を満たすための機能群構造を構築するステップ(b)と、上記記憶装置から上記機能群構造中の各機能について、当該機能を有するIPを選択して取り出して、上記機能群構造中の各機能と置き換えるステップ(c)と、上記機能群中の各機能をデータベースのアーキテクチャモデル中のコンポーネントに割り当てるステップ(e)と、上記コンポーネントのバスアクセスのための優先度を設定するステップ(f)と、上記機能群構造の各機能が上記コンポーネントに割り当てられた状態で上記機能群構造の静的な性能解析を行なうステップ(g)とを含み、上記静的な性能解析においては、上記各コンポーネントのアーキテ

クチャモデル中におけるバスアクセスの優先度をトグル数と見なして上記機能群構造の消費電力を計算する方法である。

【0028】優先度をトグル数の代わりに用いることで、トグル数がわからない静的解析においても、ある程度の確度で消費電力が求まることになる。

【0029】

【発明の実施の形態】- IPOSデバイスの基本的な構造-

ここで配線の断面積を大きく確保しつつ、多種、多機能のデバイスを内蔵した半導体装置を実現するための1つの手段として、配線層を有する半導体配線基板例えはシリコン配線基板(Super-Sub)上に、各種デバイスを内蔵したチップIPを搭載する構成がある。その場合、各チップIP内に設けられる回路(IC)は半導体装置の設計上IP(Intellectual Property)として扱うことができ、各種IPを半導体配線基板上に貼り合わせたものと考えることができる。つまり、半導体デバイス全体は、“IP On Super-Sub”であるので、シリコン配線基板とIP群とを備えた半導体デバイス全体を“IPOSデバイス”とする。

【0030】図1(a), (b), (c)は、IP(チップIP)群を搭載するための配線基板となるシリコン配線基板の平面図、シリコン配線基板上に搭載されるIP群の例を示す平面図、及びシリコン配線基板の断面図である。図1(a), (b)に示すように、シリコン配線基板10上には各種IPを搭載するための複数の領域が設けられており、各領域には、例えば、Analog-IP, Logic-IP, CPU-IP, Flashメモリー-IP, SRAM-IP, DRAM-IP, I/O-IPなどの各種IP群がチップIPとして搭載可能となっている。図1(c)に示すように、シリコン配線基板10は、シリコン基板11と、シリコン基板10上に絶縁膜(図示せず)を挟んで設けられたグランドプレーン12と、グランドプレーン12の上に層間絶縁膜を挟んで設けられた第1配線層13と、第1配線層13の上に層間絶縁膜を挟んで設けられた第2配線層14と、第2配線層14の上にパッセーション膜を挟んで設けられたパッド15とを備えている。パッド15、各配線層13, 14及びグランドプレーン12間は、それぞれコンタクト(図示せず)を介して所望の部位で互いに接続されている。そして、各IPは、パッド15上に貼り付けられて、各IPが配線層13, 14により互いにあるいはグランドプレーン12に電気的に接続される構造となっている。

【0031】シリコン配線基板10内の配線層13, 14の寸法の制約は緩やかであり、数μm幅の配線をも設けることができるので、以下のような効果がある。経験的に、今までの半導体集積回路装置の微細化が進展した過程において、もっとも配線としての特性が良好であつ

た世代の寸法を有する配線を設けることが可能となる。また、配線の電気インピーダンスを低減することができる。

【0032】そして、シリコン配線基板上のチップIPは多くの機能を有しているが、これに対しては2つの考え方がある。1つは、できるだけ多くの機能を使用するという考え方であり、もう1つは、使用する機能を制限するという考え方である。つまり、ユーザの多様な要求に応えるためには、多種の使用方法に対応できる構成を有していることが好ましいが、反面、実際の使用に際してはいずれかの機能に限定する必要がある。つまり、この2つの相反する要求を満足させることにより、ユーザの多様な要求に応えつつ、少品種、大量生産に適したIPOSデバイスを構築することができるのである。

【0033】したがって、後に選択、制限、切り換え、設定などの処理を柔軟に行なうことを前提として、つまり、機能に関する処理の柔軟性を保持しつつ、多種の機能をハードウェア(HW), ソフトウェア(SW)に分けて各IP(チップIP)に組み込むことが重要となる。

【0034】そこで、以下の実施形態においては、IPOSデバイスを例とした大規模なシステム(以下、「IPOSシステム」という)に適したHW/SW協調設計について説明する。ただし、本発明は、必ずしもIPOSシステムだけでなく、従来のいわゆるシステムLSIなどの大規模な集積回路システムの設計にも適用が可能である。

【0035】(実施形態)

-HW/SW協調設計全体の概略-

図2は、本発明の実施形態におけるHW/SW協調設計の概略的な手順を示すフロー図である。

【0036】ステップST1で、機能ライブラリ(機能Lib)やテストベンチを用いて機能設計を行ない、ステップST2で、IP機能Libを用いたIP機能設計を行なう。このステップST1, ST2では、半導体デバイスに搭載される各IPに要求される機能が例えはC言語により記述される。例えばJPEGの場合には、信号処理(アルゴリズム)だけが記載されているような状態である。

【0037】次に、ステップST3で、アーキテクチャモデルLibを用いてシステムのアーキテクチャ設計を行なう。システムのアーキテクチャモデルLibには、アーキテクチャモデルがシステムの設計に必要なHW, SWモデルとして存在しているので、このステップST3では、各モデルをバスに接続してシステム全体の概略的な構造を作り上げる。

【0038】次に、ステップST4で、各機能(機能ブロック)をアーキテクチャのコンポーネントに割り当てるマッピングを行なった後、ステップST5で、性能Libを用いて性能解析を行ない、その結果、不具合があ

ればステップST3のアーキテクチャ設計、又はステップST4のマッピングに戻り、性能が満足されるまでこれらのステップを繰り返すループ処理を行なう。

【0039】次に、ステップST6、ST7で、それぞれIPハードウェアモデルL<sub>i</sub>bを用いたHW設計と、例えばIPソフトウェアモデルL<sub>i</sub>bを用いたSW設計とを個別に行なってから、HW及びSWが詳細化されると、ステップST8で、I/Fモデルを用いたHW/SW協調検証を行なう。その後、ステップST9で、実チップを用いて実チップの機能を確認するための実チップ検証を行なう。

#### 【0040】－機能設計及びIP機能設計－

図3は、機能設計を行なうステップST1と、IP機能設計を行なうステップST2との詳細な処理の内容を説明するための部分フロー図である。

【0041】ステップST1においては、以下の手順により、機能設計を行なう。機能L<sub>i</sub>bには、f<sub>1</sub>、f<sub>2</sub>、f<sub>3</sub>、f<sub>4</sub>などの種々の機能(function)が格納されている。この機能f<sub>1</sub>、f<sub>2</sub>、f<sub>3</sub>、f<sub>4</sub>とは、例えば画像処理におけるMPEGKL、JPEG、Blue-toothなどの機能である。また、テストベンチL<sub>i</sub>bには、t<sub>b</sub>1、t<sub>b</sub>2、t<sub>b</sub>3、t<sub>b</sub>4などの種々のテストベンチが格納されている。このテストベンチt<sub>b</sub>1、t<sub>b</sub>2、t<sub>b</sub>3、t<sub>b</sub>4は、機能設計が適正か否かを判断するための与えられるデータである。例えば、図3のステップST1中に示すように、機能f<sub>1</sub>、f<sub>2</sub>、f<sub>3</sub>を組み合わせたデザインがある場合には、入力テストベンチとして、テストベンチからt<sub>b</sub>1を取り出して、これを入力データとして与える。また、出力データとして例えば画像出力のテストベンチt<sub>b</sub>2を与える。その結果、ここで作り上げたデザインが適正かどうかがある程度検証される。

【0042】次に、ステップST2におけるIP機能設計は以下の手順で行なわれる。IP機能L<sub>i</sub>bには、各機能f<sub>1</sub>、f<sub>2</sub>、f<sub>3</sub>、f<sub>4</sub>ごとに、この機能を実現するためのいくつかのIPが格納されている。例えば、機能f<sub>1</sub>に対してf<sub>1-i</sub>p<sub>1</sub>～f<sub>1-i</sub>p<sub>4</sub>があり、機能f<sub>2</sub>に対してf<sub>2-i</sub>p<sub>1</sub>～f<sub>2-i</sub>p<sub>3</sub>があり、機能f<sub>3</sub>に対してf<sub>3-i</sub>p<sub>1</sub>、f<sub>3-i</sub>p<sub>2</sub>がある。そこで、およその見当をつけて、デザイン中の機能f<sub>1</sub>、f<sub>2</sub>、f<sub>3</sub>に対して用いるIPを指定する。例えば、機能f<sub>1</sub>に対してはf<sub>1-i</sub>p<sub>4</sub>を、機能f<sub>2</sub>に対してはf<sub>2-i</sub>p<sub>1</sub>を、機能f<sub>3</sub>に対してはf<sub>3-i</sub>p<sub>2</sub>を用いるというようにパラメータを指定する。

【0043】次に、ステップST1で作り上げられたデザイン中の各機能f<sub>1</sub>、f<sub>2</sub>、f<sub>3</sub>に、それぞれf<sub>1-i</sub>p<sub>4</sub>、f<sub>2-i</sub>p<sub>1</sub>、f<sub>3-i</sub>p<sub>2</sub>を当てはめる。つまり、IP機能の選択を行なう。この段階では、選び出された各IPはいずれもステップST1における機能f<sub>1</sub>、f<sub>2</sub>、f<sub>3</sub>を有しているので、ステップST1で検

証した結果と同じ結果が得られる。

【0044】このように、機能が互いに共通する複数のIPをL<sub>i</sub>bに格納しておいて、機能ごとに適当なIPを選択することにより、IPを代えても機能の同一性が保持されるので、従来大きかった設計変更の確率をできるだけ小さくすることができる。

【0045】次に、IP機能をさらに詳細に個々の機能に分けるIP機能の階層展開を行なう。例えば、f<sub>1-i</sub>p<sub>4</sub>について階層展開をすると、f<sub>1-i</sub>p<sub>4-A</sub>（例えば逆コサイン変換）を行なってからf<sub>1-i</sub>p<sub>4-B</sub>（例えば量子化）を行ない、その後f<sub>1-i</sub>p<sub>4-C</sub>（例えばハフマン符号化）を行なうという機能になっていたとする。つまり、IPであるf<sub>1-i</sub>p<sub>4</sub>を機能ブロックf<sub>1-i</sub>p<sub>4-A</sub>、f<sub>1-i</sub>p<sub>4-B</sub>、f<sub>1-i</sub>p<sub>4-C</sub>に展開するのである。同様に、f<sub>2-i</sub>p<sub>1</sub>、f<sub>3-i</sub>p<sub>2</sub>についても階層展開を行なって、f<sub>2-i</sub>p<sub>1</sub>についてはf<sub>2-i</sub>p<sub>1-A</sub>という機能ブロックが、f<sub>3-i</sub>p<sub>2</sub>についてはf<sub>3-i</sub>p<sub>2-A</sub>、f<sub>3-i</sub>p<sub>2-B</sub>という機能ブロックがそれぞれ得られたとする。そして、この階層展開された各機能ブロックをデザイン中の各機能f<sub>1</sub>、f<sub>2</sub>、f<sub>3</sub>に置換する。この階層展開されたIPの中身をHW/SW分割するのが本発明の1つの特徴である。

#### 【0046】－アーキテクチャ設計－

次に、図4は、ステップST3における処理の内容を説明するための部分フロー図である。同図に示すように、アーキテクチャモデルL<sub>i</sub>bには、CPU、メモリ、ASIC（ロジック回路）、BUS、バスブリッジモデル、I/Fモデルなどのコンポーネント(c)についての多くの種類が格納されている。そこで、このコンポーネントごとに各種のコンポーネントパラメータをもつてるので、コンポーネントパラメータの値を与える。つまり、CPUについては動作周波数、キャッシュヒット率があり、DRAMについては動作周波数、ビット幅があり、ASICについては動作周波数、ビット幅があり、BUSについてはバスクロック、バス幅、転送レート(bps)、アービトレーション方法があり、バスブリッジモデルについてはバスブリッジ間遅延があり、I/FモデルとしてUARTを選択したときには入出力転送レート(bps)、入出力ビット幅、動作周波数、ビット幅がある。そして、各コンポーネントパラメータに具体的な値を入れる。そして、このパラメータ指定を行なってから、例えば図4に示すように、CPU1(c1)、DRAM1(c2)、ASIC1(c3)、ASIC2(c6)及びUART(c5)をBUS1、BUS2及びバスブリッジ1(c4)を介して接続した構造を有するアーキテクチャを作り上げる。

【0047】ここで、このアーキテクチャの特徴は、複数のバス(BUS1、BUS2)を備え、BUS1-BUS2間を接続するバスブリッジ1(c4)をコンポー

ネットとして設けている点である。バスは3つ以上あってもよく、このような複数のバスを設けることにより、半導体デバイスのような半導体配線基板を有する構造に適したアーキテクチャを構築することができる。複数のバスの例としては、標準バスに低速バス、高速バスなどを別途設けたものが考えられる。そして、バスプリッジモデルを設けることにより、当該バスプリッジモデルに接続される2つのバスのビット幅が互いに異なる場合などにおいてもデータの円滑な転送を図ることができる。バスプリッジモデルの例としては、16ビット幅のBUS (例えばバス1) のデータを8ビットずつ別のBUS (例えばBUS2) に送り込むバッファがある。また、アーキテクチャにおいて、I/FモデルをASICとは別に設けたことにより、入出力の信号を取り扱うI/Fモデルにおける信号の遅延や消費電力を考慮したシステムの最適化が可能になる。

#### 【0048】マッピング

次に、図5は、ステップST4、ST5におけるマッピングと性能解析の概略とを説明するための部分フロー図である。

【0049】同図に示すように、ステップST4においては、ステップST2のIP機能設計によって得られたデザイン中の階層展開されたIPを、HWとSWとに割り当てる処理であるマッピングを行なう。例えば、テストベンチtb1は、HWとしてI/FモデルであるUARTに割り当てられる。また、テストベンチtb2は、HWとしてDRAM1に割り当てられる。また、階層展開されているf1-ip4中の機能ブロックf1-ip4-A (b11) はHWとしてASIC1に、機能ブロックf1-ip4-B (b12)、機能ブロックf1-ip4-C (b13) はSWとしてCPU1に、f2-ip1中の機能ブロックf2-ip1-A (b14) はSWとしてCPU1に、f2-ip2中の機能ブロックf3-ip2-A (b15)、機能ブロックf2-ip2-A (b16) はすべてHWとしてASIC2にそれぞれ割り当てられる。

【0050】ここで、このマッピングの特徴は、テストベンチをI/Fモデルにマッピングしたことである。従

$$\begin{aligned} \text{Cost-tot} = & k_1 (\text{Speed}_{\text{HW-tot}} + \text{Speed}_{\text{SW-tot}}) \\ & k_2 (\text{Area}_{\text{HW-tot}} + \text{Area}_{\text{SW-tot}}) \\ & k_3 (\text{Power}_{\text{HW-tot}} + \text{Power}_{\text{SW-tot}}) \end{aligned} \quad (1)$$

である。ここで、k1、k2、k3は重み係数であり、Speed<sub>HW-tot</sub>はHW全体の処理速度であり、Speed<sub>SW-tot</sub>はSW全体の処理速度であり、Area<sub>HW-tot</sub>はHW全体の面積であり、Area<sub>SW-tot</sub>はSW全体の面積であり、Power<sub>HW-tot</sub>はHW全体の消費電力であり、Power<sub>SW-tot</sub>はSW全体の消費電力である。つまり、この例では、パラメータである処理速度ができるだけ大きく、面積ができるだけ小さく、消費電力ができるだけ小さくなるようにシステムを構築したいと考えていることにな

る、単に入力信号として扱われていたテストベンチをHWであるI/Fモデルにマッピングすることにより、後の性能解析の際に遅延を考慮した処理時間の解析が可能になり、また、I/Fモデルが動作することを考慮した消費電力の解析が可能になる。つまり、解析精度の向上を図ることができる。

【0051】また、このように、1つのIPをHWとSWとにわけてマッピングができるようになったのは、IP機能設計において、上述のようにIPを機能ブロックのレベルまで階層展開したからである。そして、マッピングに応じて、図5の左下に示すように、各機能とデザイン中のコンポーネントとのマッピング対応表が機能番号(a1~an)とともに作成される。また、例えば機能ブロックf1-ip4-A→機能ブロックf1-ip4-Bというパスは、ASIC1→BUS1→(DRAM1→)CPU1というデータのパスとなり、機能ブロックf1-ip4-B→機能ブロックf1-ip4-Cというパスは、CPU1→(DRAM1→)CPU2というデータのパスとなることが、ブロック間パステーブルとして作成され、設計装置の記憶装置(図示せず)に格納される。なお、括弧内のコンポーネントはその部分が経由される場合もあり、経由されない場合もあることを示している。

【0052】ここで、このように機能ブロック間パステーブルを作成することにより、後述するような動的な性能解析を精度よく行なうことができる。

【0053】次に、このようなマッピング結果を用いてステップST5における性能解析を行なう。このステップにおいては、静的解析と動的解析とを行なってもよいし、静的解析及び動的解析のうちいずれか一方のみを行なってもよい。

#### 【0054】性能解析(静的解析)

性能解析のうち静的解析は、例えば所望のパラメータを変数としてシステム全体のコスト関数(Cost-tot)を定義して、このコスト関数(Cost-tot)を求める。そして、コスト関数(Cost-tot)が最小又はある上限値以下になるかを目標として設計を進める。このコスト関数(Cost-tot)の一例として、例えば下記式(1)

る。そこで、コスト関数(Cost-tot)は小さいほどよいとする。例えば、各種のマッピングMAP1、MAP2、MAP3を行なった結果、コスト関数(Cost-tot)が図6に示す値になったとする。このときには、もっとも値が小さいマッピングMAP1が最適であると判断する。

【0055】ここで、例えば処理速度に関する計算は、マッピング結果を用いて、下記式(2)

$$\begin{aligned} \text{Speed}_{\text{HW-tot}} & (f_{\text{HW}} \sim f_{\text{HW}}, f_{\text{bus}}, R_{\text{bus}}, P_{\text{HW}} \sim P_{\text{HW}}) \\ & = \text{Speed}_{\text{HW-b11}} (f_{\text{b11}}, f_{\text{bus}}, R_{\text{bus}}, R_{\text{b11}}) + \\ & \cdots + \text{Speed}_{\text{HW-b11}} (f_{\text{b11}}, f_{\text{bus}}, R_{\text{bus}}, P_{\text{b11}}) \end{aligned} \quad (2)$$

のように行なわれる。ここで、式(2)において、図5に示すように、マッピングしたときの機能ブロック番号をb11～b16とし、コンポーネント番号をc1～c6とする。そして、fは動作周波数であり、Rはバスの転送レートであり、Pは機能のバスに対する優先順位(優先度)(0～1の値)を表している。この優先順位

$$\begin{aligned} \text{Speed}_{\text{HW-b11}} & (f_{\text{b11}}, f_{\text{bus}}, R_{\text{bus}}, P_{\text{b11}}) \\ & = 1 / (f_{\text{b11}} \times f_{\text{bus}} \times R_{\text{bus}} \times P_{\text{b11}}) \end{aligned} \quad (3)$$

のよう求められる。つまり、処理速度はできる限り小さい方が好ましいことから、動作周波数f、転送レートR、優先順位Pの逆数からコスト関数(Cost-tot)のうち処理速度Speedの成分を計算する。

$$\begin{aligned} \text{Speed}_{\text{SW-tot}} & (S t_{\text{CPU-b11}} \sim S t_{\text{CPU-b11}}, f_{\text{CPU}}) \\ & = \text{Speed}_{\text{SW-b11}} (S t_{\text{CPU-b11}}, f_{\text{CPU}}) + \\ & \cdots + \text{Speed}_{\text{SW-b11}} (S t_{\text{CPU-b11}}, f_{\text{CPU}}) \end{aligned} \quad (4)$$

により求められる。この計算の考え方方は以下の通りである。機能ブロックをfunctionによって表すと、処理はC言語によって記述することができ、C言語で記述すればアセンブリ言語にコンパイルすることが可能となる。したがって、アセンブリのステップ数で処理速度

$$\text{Speed}_{\text{SW-b11}} (S t_{\text{CPU-b11}}, f_{\text{CPU}}) = \underline{S t_{\text{CPU-b11}} / f_{\text{CPU}}} \quad (5)$$

のよう求められる。このステップ数が小さいほど速度が大きいので、式(5)の数値がなるべく小さいことが望ましいことになる。

$$\begin{aligned} \text{Area}_{\text{HW-tot}} & = \text{Area}_{\text{HW-f1-f1p4}} \\ & + \text{Area}_{\text{HW-f2-f1p1}} + \text{Area}_{\text{HW-f3-f1p2}} \end{aligned} \quad (6)$$

のように行なわれる。つまり、IP機能を選択した後でIP機能の階層展開を行なう前に使用される各IP(f1-f1p4, f2-f1p1, f3-f1p2)の情報があるので、これからHW部分の面積を求めることができる。

【0060】次に、機能ブロックをコンパイルすると、

$$\text{Area}_{\text{SW-tot}} = (\text{Msize}_{\text{SW-b11}} + \cdots + \text{Msize}_{\text{SW-b11}}) \times \text{Area}_{\text{DRAM}} \quad (7)$$

により、求めることができる。

【0061】このように、IP内が機能ブロックに分割されたことにより、機能ブロックのSWの部分からメモリサイズを計算すると、各機能ブロック間で面積を重複

$$\text{Power}_{\text{HW-tot}} = \text{Power}_{\text{HW-b11}} + \cdots + \text{Power}_{\text{HW-b11}} \quad (8)$$

のように行なわれる。すると、式(8)中の例ええば機能ブロックb11(f1-f1p4-A)の消費電力は、下

$$\begin{aligned} \text{Power}_{\text{HW-b11}} & (f_{\text{b11}}, V_{\text{b11}}) \\ & = \alpha_{\text{b11}} \times f_{\text{b11}} \times (V_{\text{b11}})^2 \times P_{\text{b11}} \end{aligned} \quad (9)$$

により、表される。ただし、 $\alpha$ は機能ブロックb11のパワー係数でIP性能L1bから抽出されるもの、 $f_{\text{b11}}$ はコンポーネントc3(ASIC1)の動作周波数、 $V_{\text{b11}}$ はコンポーネントc3(ASIC1)の電圧、 $P_{\text{b11}}$ はコンポーネントc3(ASIC1)の優先順位(優先

Pは、バスに接続されるすべてのコンポーネントの優先度を合計すると1になるように設定されている。

【0056】すると、式(2)中の例ええば機能ブロックb11(f1-f1p4-A)の処理速度は、下記式(3)

【0057】次に、式(1)中のSWについての処理速度成分Speed<sub>SW-tot</sub>は、マッピングのブロック間パステープルに基づいて、下記式(4)

を演算することができるからである。

【0058】ここで、すると、式(4)中の例ええば機能ブロックb11(f1-f1p4-A)の処理速度は、下記式(5)

【0059】次に、面積に関する計算は、マッピング結果を用いて、下記式(6)

アセンブリでメモリサイズがわかるので、SWのメモリの部分をすべて加算しておいて、それにエリアDRAMというデータベースを用いてDRAMの1ビット当たりの面積(単価)を計算する。それに、メモリサイズを乗じると、下記式(7)

して計算する場合があるので、これを考慮して面積の計算精度の悪化を防止するのである。

【0062】次に、HW部分の消費電力に関する計算は、マッピング結果を用いて、下記式(8)

$$\text{記式 (9)}$$

度)を示している。この優先度をトグル数の代わりに用いることで、トグル数がわからない静的解析においても、ある程度の精度で消費電力が求まることになる。

【0063】また、SW部分の消費電力に関する計算は、下記式(10)

$$\text{Power}_{\text{SW-tot}} = \text{Power}_{\text{SW-CPU-tot}} + \text{Power}_{\text{SW-MEM-tot}} \quad (10)$$

により求められる。式(10)の第1項は、

$$\text{Power}_{\text{SW-CPU-tot}} = \alpha_{\text{CPU}} \times f_{\text{CPU}} \times \text{Load}_{\text{CPU}} \quad (11)$$

となる。ここで、 $\alpha_{\text{CPU}}$ はCPUのパワー係数でIP性能L<sub>i b</sub>から抽出されるもの、Load<sub>cpu</sub>はCPUロード(0~1)であって、「SWにマッピングされた機能ブロックのメモリサイズの合計(bit)」を「すべての

$$\text{Power}_{\text{SW-MEM-tot}} = \alpha_{\text{DRAM}} \times f_{\text{DRAM}} \times (V_{\text{DRAM}}) \times P_{\text{DRAM}} \quad (12)$$

となる。 $\alpha_{\text{DRAM}}$ はDRAMのパワー係数でIP性能L<sub>i b</sub>から抽出されるもの、f<sub>DRAM</sub>はDRAMの動作周波数(Hz)、V<sub>DRAM</sub>はDRAMの電圧、P<sub>DRAM</sub>はDRAMの優先順位を示している。この優先度を用いることで、トグル数がわからない静的解析においても、ある程度の確度で消費電力が求まることになる。

【0065】そして、以上の計算を行なって上で、式(1)から最終的に決定されるコスト関数(Cost-tot)が最小になるか、下限値以下になったときに静的解析に関する限り、設計されたシステムが適切であると判断する。

#### 【0066】-性能解析(動的解析)-

動的解析においては、面積Areaについては静的解析と同じであるので、処理速度Speedと消費電力Powerのみを求める。動的解析においては、設計システムに実際にデータを入力させて動作させるシミュレーションを行なう。したがって、実行時間(Time(sec))や、各機能ブロックの入出力データ、トグル率がシミュレーションから得られる。

【0067】そこで、動的解析においては、基本的には、この得られた要素を上記式(1)~(12)に代入することにより、コスト関数(Cost-tot)の値を求めることができる。その際、式(1)における(Speed<sub>HW-tot</sub>+Speed<sub>SW-tot</sub>)は、シミュレーションで得られた時間Timeに置き換えることができ、式(9)における各コンポーネントの優先順位Pはシミュレーションで得られた各コンポーネントのトグル数で置き換えることができる。そして、式(11)におけるCPUロードLoad<sub>cpu</sub>は、実際のシミュレーションから求まる平均ロードを用いる。

【0068】さらに、式(12)におけるDRAMの優先順位P(優先度)はシミュレーションで得られたDRAMのトグル数で置き換えることができる。

#### 【0069】-HW/SW分割(静的分割)-

次に、ステップST4、ST5と共に進行なわれるIP内のHW/SW分割について説明する。HW/SWには静的分割と動的分割とがあるが、まず、静的分割について説明する。

【0070】図7は、静的なHW/SW分割を説明するための図である。同図に示すように、半導体デバイスなどのシステムに利用されるハードIPには、機能A、機能B、機能C、機能Dがあり、かつ、これらの機能のO

機能ブロックをSWにマッピングしたときのメモリサイズの合計(bit)」で除したものである。

【0064】一方、式(10)の第2項は、

N·OFFを設定するための設定レジスタがある。ただし、HW/SW分割における「機能」とは本実施形態における「機能ブロック」を意味している。一方、IP性能L<sub>i b</sub>には、各機能A、機能B、機能C、機能DについてのSWモデルが例えばC/C十言語によって記述されて格納している。このとき、各機能をHWとSWによって動作させた結果、1つの機能を変更、修正、削除する必要が生じる場合がある。ここで、例えば、設定レジスタ内の機能DをOFFにすることで、例えば機能Dへのクロックの供給を停止するなどの制御を行なって、機能Dが動作しないようにすることができる。これにより、無駄な電力の消費を抑制して消費電力の低減を図ることができる。また、各機能A~D間の接続を変更することもできる。

【0071】さらに、例えば1つの機能DをHWからIP性能L<sub>i b</sub>に用意されたSWモデルに切り換えること、用意しているL<sub>i b</sub>内のSWモデルを修正することもできる。つまり、いずれかのL<sub>i b</sub>内に各機能と等価なSWモデルを準備しておくことにより、1つのIP内をHW/SW分割することができ、ハードIPの機能が不足したときにも設計を進めることができる。また、SWの機能を修正、追加することにより、システムの変更に柔軟に対応することができる。

#### 【0072】-動的なHW/SW分割-

次に、動的なHW/SW分割について説明する。図7に示すHW/SW分割は、HW、SWの設定を行なった後は、原則としてその後の修正は行なわない。それに対し、動的なHW/SW分割、つまりHW/SW動作の切り換えにおいては、機能(機能ブロック)が動作しながら柔軟に変更、追加、修正を受けることができる。このような動的なHW/SW分割の例として、以下、第1~第3の具体例について説明する。

#### 【0073】1. 第1の具体例

第1の具体例では、図7に示すIPにおいて、各機能のON、OFFをSWによって制御し、かつ、停止させる場合はIP性能L<sub>i b</sub>から同等のSWモデルを呼びだしてこれを用いる。設定レジスタへの制御信号により、各機能を動作させながらHW/SWの切り換えを行なうことができる。

#### 【0074】2. 第2の具体例

図8(a)、(b)は、動的なHW/SWの切り換えにおける消費電力Powerのタイムチャート図である。ま

た、図9は、このHW/SWの切り換え制御のためのプログラムの例をC言語で示す図である。図9に示すように、設定レジスタの制御により、ハードIPの機能Cを動作させた場合に、図8(a)に示すように、IPの消費電力Powerが消費電力の上限値MAXpowerを越える時があるとする。動的解析からどの機能が動作しているかが時間軸に応じてわかるので、あるレジスタに各機能の消費電力の合計を計算しながら書き込んでおいて、その値が上限値MAXpowerを超えるときを検出すればよい。そして、IPの消費電力Powerが消費電力の上限値MAXpowerを超えると、図9に示すように、設定レジスタの制御によりハードIPの機能CをOFFにして、代わりにSWモデルからfunc-Cを呼び出してこちらを動作させる。これにより、図8(b)に示すように、消費電力Powerが上限値MAXpowerを超えることがなくなり、所望の制約条件の下での作動を確保することができる。つまり、この例では、当該IPの機能A、Cが動作する期間には機能CがSWによって実現にされるが、機能A、B、Cが動作する期間には機能CがHWによって実現されるうに設計することになる。

#### 【0075】3. 第3の具体例

図10(a), (b)は、動的なHW/SWの切り換えにおける処理速度Speedの消費電力依存性を示す図である。また、図11は、このHW/SWの切り換え制御のためのプログラムの例をC言語で示す図である。図11に示すように、CPUの設定レジスタの制御により、CPUのロード(%)がある値IDLEよりも大きいときには機能CをSWにより実行し、CPUのロード(%)がある値IDLE以下のときに機能CをHWにより実行するよう制御する。つまり、機能Cを常にHWで実行すると、図10(a)に示すように処理時間Timeが上限値MAXtimeを越える事態が発生する。そこで、レジスタにCPUのロード(%)を検知しながら書き込んでおいて、CPUのロード(%)が下限値IDLEを越えるときを検出しながら、CPUのロード(%)がある値IDLE以下のときには機能CをHWにより実行する。そして、CPUのロード(%)が下限値IDLEを越えると、設定レジスタの制御によりハードIPの機能CをOFFにして、代わりにSWモデルからfunc-Cを呼び出してSWを動作させる。このような制御を行なうことにより、図10(b)に示すように、処理時間Timeが上限値MAXtimeを越えることがなくなり、所望の制約条件の下での作動を確保することができる。

#### 【0076】-HW/SW協調検証-

次に、ステップST8の協調検証について説明する。上述のステップST4のマッピング処理、ステップST5の性能解析処理に基づいて最終的に決定されたHW、SWの構成に従い、ステップST6、ST7で、HW設計とSW設計を行なって、HWモデルとSWモデルとをそれぞれ作成する。HWモデルを作成する際にはIPハ

ードウェアモデルLib (BCA, RTL又はゲートレベルで記述) を利用し、SWモデルを作成する際にはIPソフトウェアモデルLib (C言語、C++言語又はアセンブラーで記述) を利用する。

【0077】次に、ステップST8では、ステップST6、ST7で作成したHWモデル及びSWモデルを利用して、HW/SW協調検証を行なうが、そのためにはHW-SW間のI/Fモデルが必要となる。そこで、以下の手順により、I/Fモデルモデルを作成する。

【0078】まず、図13に示すようなメモリマップを作成する。このメモリマップは、SWにプログラムをコンパイルしたものである。HWは、レジスタをメモリにマッピングする。

【0079】そして、各機能ブロックのアドレスを決定し、各機能ブロックのアドレステーブルをデータベース化して、メモリマップDBに登録する。そして、図14に示すように、メモリマップDBに登録されたHWのレジスタとアドレスとの対応表をとりだして、アドレスデコーダを作成する。

【0080】バスコントローラは、各HWブロックのP(優先度)にしたがって、各バス毎のアビトレーション方法ごとに用意したHDLテンプレートを生成する。すなわち、バスコントローラは、各ハードウェアのレジスタアドレスをメモリマップDBから抽出して、関数を作成し、これをドライバー関数テンプレートとしてSWモデルに格納する。

【0081】図15は、基本ハードウェアアクセス用のドライバー関数テンプレートの一例を示す図である。このようなメモリマップDB、アドレスデコーダ、関数テンプレートを利用することにより、設計されたシステムのHWによってSWを動作させたり、システムのSWによってHWを動作させることができ、HW/SW協調検証を行なうことができる。

#### 【0082】

【発明の効果】本発明により、IPの機能に着目してより最適化された半導体集積回路装置を形成するための設計が可能になった。

#### 【図面の簡単な説明】

【図1】(a), (b), (c)は、IP群を搭載するための配線基板となるシリコン配線基板の平面図、シリコン配線基板上に搭載されるIP群の例を示す平面図、及びシリコン配線基板の断面図である。

【図2】本発明の実施形態におけるHW/SW協調設計の概略的な手順を示すフロー図である。

【図3】機能設計とIP機能設計との詳細な処理の内容を説明するための部分フロー図である。

【図4】システムアーキテクチャ設計における処理の内容を説明するための部分フロー図である。

【図5】マッピングと性能解析の概略とを説明するための部分フロー図である。

【図6】各種のマッピングを行なった結果のコスト関数(Cost-tot)の値の例を示す図である。

【図7】静的なHW/SW分割を説明するための図である。

【図8】(a), (b)は、動的なHW/SWの切り換えにおける消費電力Powerのタイムチャート図である。

【図9】消費電力を考慮したHW/SWの切り換え制御のためのプログラムの例をC言語で示す図である。

【図10】(a), (b)は、動的なHW/SWの切り換えにおける処理速度Speedの消費電力依存性を示す図である。

【図11】処理速度を考慮したHW/SWの切り換え制御のためのプログラムの例をC言語で示す図である。

【図12】協調検証を説明するための図である。

【図13】SWにプログラムをコンパイルして得られたメモリマップを示す図である。

【図14】メモリマップDBに登録されたHWのレジスタとアドレスとの対応表をとりだして、アドレスデコードを作成する処理を示す図である。

【図15】基本ハードウェアアクセス用のドライバーフィルターテンプレートの一例を示す図である。

【符号の説明】

|     |          |
|-----|----------|
| 1 0 | シリコン配線基板 |
| 1 1 | シリコン基板   |
| 1 2 | グランドプレーン |
| 1 3 | 第1配線層    |
| 1 4 | 第2配線層    |
| 1 5 | パッド      |

フロントページの続き

| (51) Int. Cl. | 識別記号  | F I           | マニュート(参考) |
|---------------|-------|---------------|-----------|
| G 0 6 F 17/50 | 6 6 4 | G 0 6 F 17/50 | 6 6 4 A   |
|               | 6 6 6 |               | 6 6 6 T   |
|               | 6 6 8 |               | 6 6 6 X   |
| H 0 1 L 21/82 |       | H 0 1 L 21/82 | 6 6 8 A   |
| 27/04         |       |               | B         |
| 21/822        |       | 27/04         | C         |
|               |       |               | U         |

F ターム(参考) 5B046 AA08 BA02 KA06  
 5F038 CA03 DF04 DF05 DF12 DF14  
 EZ08 EZ09 EZ10 EZ20  
 5F064 BB02 BB09 BB12 BB13 BB14  
 BB21 EE09 EE22 EE27 EE41  
 EE47 HH06 HH08 HH09 HH10  
 HH12